提取html页面中所有以.js扩展名结尾的链接
Extract all links which ends with .js extension in html page
我想提取html页面中所有以.js结尾的链接。我能够获取脚本标记中的链接但是我如何从属性中获取链接,例如{"yui":"http://l.yimg.com/nn/lib/metro/g/uicontrib/yui/yui_3.4.1.js"}。我希望这是在php 中完成的
一个用PHP5+编写的简单PHP HTML DOM解析器,支持无效HTML,并提供了一种非常简单的方法来处理HTML元素。使用类似jQuery的选择器在HTML页面上查找标记。在一行中从HTML中提取内容。
以下是获取它的链接:http://sourceforge.net/projects/simplehtmldom/
这是官方网站:http://simplehtmldom.sourceforge.net/
对于可以使用的基本HTML元素http://code.google.com/p/phpquery/解析DOM内容(它像CSS选择器一样处理jquery,像attr
、find
这样的函数)。以下是如何在PhpQuery中使用选择器的示例http://code.google.com/p/phpquery/wiki/Selectors.
对于属性,它取决于:
- 某种regexp,如果它们是在Javascript或其他东西中
- 如果它们在数据属性中,并且您知道属性名称,那么您可以获得json字符串,并简单地对其运行
json_decode
php函数
相关文章:
- 从Chrome扩展名中的popup.html文件在background.js文件中运行一个函数
- '的文件格式和扩展名;file.xls'don't与fileSaver.js匹配
- 在 iFrame 中注入 JS 文件,通过 Google chrome 扩展名中的 ContentScript 进行
- 如何使用office.js检查未保存文件的具体文件扩展名
- 提取扩展名为JS的图像文件名
- 将JavaScript代码迁移到具有String.prototype扩展名的node.js模块
- 火狐扩展名中的远程 Js 文件
- 如何在Chrome扩展名的内容JS文件中包含其他JavaScript文件
- 未捕获的引用错误:即使在加载 JS 后,在 chrome 扩展名中也没有定义 HTMLInspector
- 在所有浏览器上执行没有扩展名.js外部脚本重定向
- 使用交叉骑手时,使用多个文件而不是一个扩展名.js文件
- 使用 PHP 或 JS 检查域扩展名
- 是否可以阻止requireJS自动添加.js文件扩展名
- 加载带有require的html文件时.js扩展名错误
- 如何在多文件.js中上传文件时检查文件扩展名
- 提取html页面中所有以.js扩展名结尾的链接
- 当一个JS文件需要另一个没有. JS扩展名的JS文件时,出现404
- 获取Node.js中没有扩展名的文件的MIME类型
- 对js文件进行gzip压缩会创建一个归档文件,而不是在文件输出上附加gz扩展名
- Html,js文件在mac上显示为文本,甚至在检查扩展名和文本类型之后