用于提取 HTML 标记的 XPaPath
xpath for extracting html tags
我想从这种形式的给定 html 中提取城市和州
<table class="wikitable sortable">
<tr>
<th>Name of City/Town</th>
<th>Name of State</th>
<th>Classification</th>
<th>Population (2001)</th>
<th>Population (2011)</th>
</tr>
<tr>
<td><a href="/wiki/Abhayapuri" title="Abhayapuri">**Abhayapuri**</a></td>
<td><a href="/wiki/Assam" title="Assam">**Assam**</a></td>
<td>TC</td>
<td style="text-align:right;">14,673</td>
<td style="text-align:right;"></td>
</tr>
我试过这样做 $x('//table/tbody/tr/td/a')
但它返回了我不需要的结果(即包含智利节点、子节点、类列表、innerHTML 和其他元数据的列表)。不知道我做错了什么
这个 XPath:
$x('//table/tbody/tr/td/a/text()')
会让你得到城市和州:
["**Abhayapuri**", "**Assam**"]
这个XPath将带你去城市:
$x('//table/tbody/tr/td[1]/a/text()')
["**Abhayapuri**"]
这个 XPath 会给你状态:
$x('//table/tbody/tr/td[2]/a/text()')
["**Assam**"]
相关文章:
- 在数据提取完成之前进行页面渲染
- 如何在Javascript中从字符串中提取某些单词
- RegEx JavaScript:数字后的符号提取
- 如何在内联依赖项并将图像转换为dataURI的情况下完全提取网页
- Regex提取URL返回数组的一部分;未定义”;
- 如何提取“;href"最近列表项中的属性值
- 使用时刻.js从日期时间中提取时间
- 通过javascript从会话中提取用户名
- HTML页面如何提取通过表单传递的参数
- 是否可以自动拉取“随机”;标签“;从一长串文本中提取
- innerHTML的子字符串可以在初始调用时提取吗
- 如何使用phonegap从安卓设备中提取联系人的字母顺序
- 如何从特定页面中提取php变量值
- 从字符串中提取年份的Javascript正则表达式
- 如何使用JavaScript提取此url的一部分
- 使用BeautifulSoup从Javascript中提取文本以获得关注者数量
- 使用javascript从字符串中提取浮点数
- 如何使用另一个字符串作为模板从字符串中提取数据
- 如何使用angular js从2个表(在sql server中)中提取数据
- 用于提取 HTML 标记的 XPaPath