www.Bo.lt,或如何复制包括儿童文件在内的整个网页
www.Bo.lt, or how to make a copy a entire webpage including children files
您可能已经注意到Bo.lt等服务允许您编辑网站并显示结果。据我所知,他们首先复制了一个网站的
喜欢在http://lll.bo.lt/ev5ct
因此,我的问题是,为了实现它,从页面中提取所有页面或DOM,并将其复制到我的服务器(包括子文件)的最佳实践是什么?
我知道这听起来是个大问题,但我只需要在php/javascirpt
@Frank Farmer说得对。您还可以编写一个小蜘蛛来索引链接、抓取链接并存储它们。这将为您提供学习如何做到这一点的练习。
我使用了CURL,而且速度更快、更容易。
相关文章:
- SuiteScript2.0-包括一个自定义文件
- 在ng中给出文件路径包括什么
- 包括php文件和几个js文件
- 在部署ckeditor时,我需要包括插件文件夹吗
- 使用 JavaScript 执行一行 PHP(不包括 PHP 文件)
- 捆绑器不包括 .min 文件
- 茉莉花Maven插件包括我的脚本使用文件协议
- MVC Razor,包括来自另一个项目的JS/CSS文件
- 包括从外部文件到HTML的查询功能(使用Dropbox进行本地测试)
- 包括javascript文件
- 包括外部JS文件和设置变量
- php检测浏览器窗口宽度,然后包括适当的php文件
- 将文件夹中的所有图像包括在阵列中的最佳方式是什么
- 包括js文件和使用jquery就绪范围内的函数
- 包括外部朱利叶斯文件
- 节点.js包括JS文件和设置变量
- Codeigniter,包括javascript文件
- 重载Javascript文件(包括事件,变量等)
- & # 39;永远# 39;日志文件包括STDOUT和STDERR内容
- 删除Mongo GridFs中的所有文件(包括文件和块)