如何在脚本/ CLI中分析javascript处理后的网页标记

How to analyze the markup of a web page after javascript processing within a script/from CLI?

本文关键字:处理 javascript 网页 脚本 CLI      更新时间:2023-09-26

我一直在研究在脚本内或从命令行分析javascript处理后的网页标记的标准实践,即没有任何浏览器?

这需要在Linux环境中进行。是否有"可安装的",将允许您传递HTML标记,包括javascript,它将返回标记后模拟一个标准的浏览器请求和所有javascript调用已经完成?

如果你能想到任何Perl模块,那将会更有帮助。

我一直在看https://developer.mozilla.org/en/SpiderMonkey和http://search.cpan.org/~mschilli/JavaScript-SpiderMonkey-0.12/SpiderMonkey.pm,但我不确定这是否允许我在一个完整的HTML文档中传递,并得到处理的版本与所有javascript DOM操作回来?

请告诉我。

更新,我明白了

我把它都弄明白了——这就是需要做的:

#!/usr/bin/perl
use WWW::Scripter;
$w = new WWW::Scripter;
$w->use_plugin('JavaScript');
$w->get('http://www.google.com');
print $w->content(),"'n";

你必须使用浏览器,一个像WWW::Scripter::Plugin::Javascript这样的新浏览器或者WWW::Mechanize::Firefox

也许解决方案可以是像PhantomJS这样的无头浏览器。不是perl模块,但对于前端测试和自动化非常实用。