PHP简单HTML DOM:如何查找Javascript中存在的URL

PHP Simple HTML DOM: How Do I Find Urls Exist In Javascript

本文关键字:Javascript 查找 存在 URL HTML 简单 DOM 何查找 PHP      更新时间:2023-09-26

PHP:我正在使用Simple Html-Dom Parser解析一些页面,我已经做了很多工作,但仍有一点停滞不前。

如何获取驻留在javascript函数中的url。(URL是随机的)像这个

<script> 
    lstImages = array();   
    lstImages.push("abc.com/123873.php");
    lstImages.push("abc.com/125673.php");
</script>

我该怎么得到它们?它们的数量可以是随机的,有些页面有20页,有些有25页等等

我们将不胜感激,我已经筋疲力尽了。

样本代码:

require "simple_html_dom.php";
$html = file_get_html('pages.html');
$file = fopen("links.txt","w");
foreach($html->find('a') as $link) {
    echo fwrite($file,$link->href."'n");
}

由于不能使用DOM解析器来抓取Javascript,因此可以使用正则表达式来执行此操作。

使用此:

$html = file_get_html('pages.html');
$re = "/push''('"(.*)'"'')/"; 
$str = $html;
preg_match_all($re, $str, $matches);

$matches现在包含一个带有您URL的数组。