使用 web-harvest 抓取 HTML 文件中的 javascript 变量
Crawling a javascript variable inside HTML file with web-harvest
我有一个问题(也许是假的(。假设我在 html 页面中有以下代码片段,其中包含一堆其他内容(其他脚本标签和 html 标签(:
<script type="text/javascript">
var count = 0;
var active = false;
var mapData = **{"points": [{"type":"origin","name":"6003","lnglat":"174.77851504231018,-41.278763329010459,0'n"}]}**;
</script>
我只想抓取 mapData 变量的内容(在上面的例子中以粗体显示(。
我正在努力解决需要在 xml 配置文件中使用的 xpath 表达式,以便仅获取 mapData 变量内容。由于我是XPath/Web-harvest的新手,我不确定解决方案是使用xpath表达式还是其他方法。
所有其他时候,我的抓取都是基于 HTML 标签和其中的 id 属性的名称,但现在我在文件中只有很多脚本标签,我需要获取 mapData 变量。
有什么想法吗?
请尝试使用 ${SiteURL} 是您的网站网址:
<xpath expression="for $m in $x//script[contains(text(),'var mapData')] return normalize-space(substring-after($m,'var mapData ='))">
<html-to-xml>
<http url="${SiteURL}"/>
</html-to-xml>
</xpath>
相关文章:
- 将函数的上下文应用于javascript变量
- 如何通过ajax刷新JSF填充的javascript变量
- Javascript变量赋值|
- 限制javascript变量的最小/最大整数
- 来自文本输入null的html javascript变量
- 访问jsrender模板中的全局javascript变量并更新它
- 从数据库中获取数据并插入JavaScript变量
- 如何将javascript变量传递到Meteor Spacebars模板中
- 将JavaScript变量保存到Rails模型
- 在if语句下的html中使用javascript变量
- Javascript变量分配-按类别
- 操作javascript变量[HTML]以只显示文本
- 无法比较javascript变量
- 如何将smarty变量与javascript变量进行比较
- 如何使用PHP将javascript变量添加到mysql数据库中
- Javascript 变量使用 jquery 查找变量
- 重新加载页面时Javascript变量发生变化
- 在asp classic中使用javascript变量
- 全局Javascript变量变为null
- 如何向服务器端提交javascript变量