不要希望在通过JSOUP解析时创建文档结构

Don't want the document structure to be created while parsing through JSOUP

本文关键字:创建 文档 结构 JSOUP 希望      更新时间:2023-09-26

我使用Jsoup API来使用Jsoup.parse()方法解析HTML的一部分。但是,在解析时,它会将文档结构添加到HTML内容中。

例如:

<p><a href="some link">some link data</a> Some paragraph content</p>

<html>
<head></head>
<body>
<p><a href="some link">some link data</a> Some paragraph content</p>
</body>
</html>

我不需要解析后的文档结构(我不需要html, head, body标签)。有什么办法吗?提前谢谢。

<<p> 解决方案/strong>

我使用了body()和html()方法的文档

Document storyBodyDoc;
storyBodyDoc = Jsoup.parse(body);
storyBodyDoc.body().html()

谢谢你的建议

您可以选择body-element的子元素:

Document doc = Jsoup.parse("<p><a href='"some link'">some link data</a> Some paragraph content</p>");
Elements content = doc.body().children();