在Javascript中使用XPath提取文本
Extracting text using XPath in Javascript
我在抓取网站时遇到问题。我正在使用javaScript,并试图使用XPath将scraper发送到正确的方向。
我用FireBug得到了我需要的Xpath。
/html/body/div[3]/div[3]/div[2]/div[9]/div/div
但我不确定xpath是应该放在段落所在的div中,还是直接放在paragraf中?我还想知道,如果信息被返回,会是什么样的?节点是返回的还是我使用名为的函数返回的实际文本
ZU.xpath(doc, '/html/body/div[3]/div[3]/div[2]/div[9]/div/div');
您必须直接进入段落以获取文本见下文和示例
$x('//*/html/body/div[3]/div[3]/div[2]/div[9]/div/div/p/text()')
相关文章:
- 在数据提取完成之前进行页面渲染
- 如何在Javascript中从字符串中提取某些单词
- RegEx JavaScript:数字后的符号提取
- 如何在内联依赖项并将图像转换为dataURI的情况下完全提取网页
- Xpath运行缓慢的查询
- Regex提取URL返回数组的一部分;未定义”;
- 如何提取“;href"最近列表项中的属性值
- 使用xpath选择所有具有onclick的锚标记
- 使用时刻.js从日期时间中提取时间
- 通过javascript从会话中提取用户名
- HTML页面如何提取通过表单传递的参数
- 是否可以自动拉取“随机”;标签“;从一长串文本中提取
- innerHTML的子字符串可以在初始调用时提取吗
- Scrapy和Xpath从javascript代码中提取数据
- 如果我知道XPATH,如何使用JavaScript从DOM中提取Element值
- xPath - 从锚链接中提取 href 的内容
- 使用xpath脚本从html源代码中提取元素
- jMeter-XPath提取器不允许BSF后处理器(使用javascript代码)访问多个提取的匹配项
- 在Javascript中使用XPath提取文本
- 为给定元素提取XPath查询