如何在 Java 中从 HTML 页面中提取 JavaScript 链接

How to extract JavaScript link from HTML page in Java?

本文关键字:提取 JavaScript 链接 HTML Java 中从      更新时间:2023-09-26

我在Java中有HTML页面作为字符串,我需要从中提取JavaScript链接。有没有好的和易于使用的库,我可以使用?我查了Cobra和Neko,但我不认为(也许我错了)他们有我需要的东西,比如获取标签特定的内容。

看看 JSoup。 它是一个HTML解析器,具有选择器DSL(域特定语言),用于查找dom的元素。

例如,要查找所有带有href a标签,您可以这样做:

Document doc = Jsoup.connect("http://www.google.com/").get();
Elements hrefAnchors = doc.select("a[href]"); 

如果您已经将 html 下载为String,则可以使用 parse(String) 方法:

String html = "<p>Welcome to <a href='http://www.google.com/'>Google</a>.</p>";
Document doc = Jsoup.parse(html);