如何使用 jsoup 选择 html 文档的叶标签
How to select leaf tags of an html document using jsoup
我正在使用jsoup来解析html文档。我需要提取所有子div 元素。这基本上是没有嵌套div 标签的div 标签。我在java中使用了以下内容来提取div标签,
Elements bodyTag = document.select("div:not(div>div)");
下面是一个示例:
<div id="header">
<div class="container">
<div id="header-logo">
<a href="/" title="mekay.com">
<div id="logo">
</div> </a>
</div>
<div id="header-banner">
<div data-type="ad" data-publisher="lqm.j2ee.site" data-zone="ron">
</div>
</div>
</div>
</div>
我只需要提取以下内容:
<div id="logo">
</div>
<div data-type="ad" data-publisher="lqm.j2ee.site" data-zone="ron">
</div>
相反,上面的代码片段返回所有div 标记。所以,你能帮我弄清楚这个选择器有什么问题吗
这个完美地工作
Elements innerMostDivs = doc.select("div:not(:has(div))");
在线试用
- 添加您的 HTML 文件
- 添加 CSS 查询作为
div:not(:has(div))
- 检查结果元素
如果您只想要没有任何子级的叶子div
请使用这个
Elements emptyDivs = document.select("div:empty");
您现在使用的选择器表示 fetch me all the divs that are not direct children of another div
.它带来第一个父级div是正常的,因为div id="header"
不是div
的直系子级。它的父级很可能是body
.
相关文章:
- 在<页眉>标签
- Ckeditor-plugin:插入虚假元素add不情愿<p>标签前后
- Ember.js 带有 ember 路由器的标签标签的文本字段 ID
- 标签标签中的复选框:Chrome和Firefox中的不同结果
- 如何从标签标签中获取名称
- 防止<标签>标签>调整大小
- 如何使用 jsoup 选择 html 文档的叶标签
- 如何使用javascript从标签标签中获取文本
- 我可以用标签做标签标签吗
- 模式窗口上的标签标签不起作用
- 在我的标签标签后预先键入span标签以进行搜索.如何正确添加标签
- 单选按钮在标签标签内使用时发生故障
- 如何使用css选择没有span的标签标签
- 在Rally中抓取标签/标签的名称属性
- jQuery根据标签标签从span标签返回文本
- 我如何添加一个标签/标签出现在几个对象的顶部,以便当用户单击对象时,标签始终面向相机
- 将javascript放入html标签标签中
- 如何使用jquery更新标签标签
- Javascript隐藏内容在标签标签和标签标签之后
- 当输入值不为空时,标签标签应保持在顶部