JSOUP:从HTML文档中解析Javascript字段
JSOUP: Parsing Javascript fields from an HTML document?
我对JSOUP相当陌生,使用Element.select解析标签或id值时没有遇到任何问题。我遇到的问题是如何在页面中筛选 javascript 代码。在这里我加载文档:
Document doc = Jsoup.connect(pageUrl)
.userAgent(Agent)
.timeout(5000)
.get();
我尝试提取的 javascript 字段值如下:
arrayGPSLocation["0"] = "-19473982376,6848295867";
arrayGPSLocation["1"] = "-19473982376,6848296245";
由于这些数组值不在标准代码标记中<>JSOUP是执行此操作的合适方法吗?我喜欢JSOUP的API。唯一的其他方法是将字符串例程组合在一起......即:
int start = pageBuffer.indexOf("arrayGPSLocation['" + counter + '"]");
int end = pageBuffer.indexOf(";");
String result = pageBuffer.subString(start,end);
此伪代码示例在分析大页面时会出现严重的性能问题。有谁知道如何使用 JSOUP 完成此操作,或者我应该编写自己的刮刀?
你所能做的就是选择包含javascript代码的元素,将其值获取为字符串并处理这个字符串。就像你举个例子一样。
相关文章:
- JavaScript 检查隐藏字段中的值并将其设置为隐藏字段值
- javascript中的表达式引擎字段
- 如何使用javascript var引用Mongo DB集合's字段
- SIMPLE Javascript代码,用于显示谷歌电子表格中单个字段的数据
- 如何使用javascript将字段强制设置为false
- 如何创建具有默认值的JavaScript对象字段?(AngularJS模型相关)
- 如何验证日期、月份和日期的3个独立输入字段;年使用jquery或javascript
- 在使用javascript的输入字段中,只接受20的倍数(例如40,60,80)
- ASP.net Javascript函数中的隐藏字段为null
- 使用JavaScript获取隐藏的Django字段
- 时间字段上的JavaScript验证(不接受0:00格式)
- 删除创建的 JavaScript 字段集
- JSOUP:从HTML文档中解析Javascript字段
- 表单验证清除JavaScript字段
- 获取对象中具有特定名称的javascript字段
- 记录到控制台的JavaScript字段总是“未定义”
- Javascript字段验证表单
- 如何在不显式调用Javascript字段的情况下更新模型字段
- 仅供管理员编辑的Javascript字段
- 使用JavaScript字段填写并提交自动登录