获取更新的HTML源代码
Getting Updated HTML Source
我正试图获得一个网站的HTML
源代码,该网站没有所有可用的内容。HTML的重新加载是通过JavaScript
完成的。当我尝试连接到URL
并获得HTML
时,它将不包含所有内容。
这是我到目前为止的代码:
import java.io.IOException;
import org.jsoup.Jsoup;
public class AudioLibrary
{
public static void main(String[] arguments) throws IOException
{
String htmlSource = Jsoup
.connect("https://www.youtube.com/audiolibrary/music").get()
.html();
System.out.println(htmlSource);
}
}
如何确保JavaScript
在检索HTML源之前完成其工作?在我的例子中,它显然是从YouTube音频库中免费下载的音乐列表。
JavaScript在浏览器中运行,因此您将得到的是基本页面,可能带有JavaScript代码,但不是由JavaScript创建的最终修改的HTML页面,因为您从未执行过JavaScript。
你正在下载一个文本文件(HTML)。就是这样。如果您是浏览器,您现在将在页面中运行JavaScript,然后修改此HTML。但是由于您不运行JavaScript,因此没有任何修改,您只能使用基本页面。
相关文章:
- 在不更改HTML源代码的情况下,在管理员TinyMCE编辑器中突出显示文本
- 如何在HTML源代码中提取javascript变量
- 如何在internjs中打印createpage中的HTML源代码
- 将 x-editable 源代码放在 html 而不是 JavaScript 中
- 客户端 JavaScript 没有定义 - 但它在 HTML 源代码中.任何人都知道为什么
- 在D3插件sankey.js和html代码之间定义源代码
- VB.NET-WebBrowser没有't在html源代码中显示javascript创建的html元素
- 如何使用Html敏捷包获得具有实际源代码的javascript代码
- 如何在PhantomJS中使用iframes获得完整的解释html源代码
- 如何用程序禁用HTML视图源代码或加密HTML元素
- jQuery验证后,$.ajax返回HTML源代码
- 如何从 URL HTML 源代码中获取特定信息
- 如何转换从数据库中检索的 svg 源代码并将其显示为 html 中的图像
- 如何在不获取整个源代码的情况下解析 HTML 源代码
- 在Grails模板中呈现的HTML不会附加到页面源代码(DOM)
- jQuery更改元素属性并返回编辑后的Html源代码
- 从 html 源代码中删除 vbscript 或停用 vbscript
- 我可以使用Jquery获取元素的HTML源代码吗?
- Javascript/jQuery/html:当涉及“硬”刷新时,如何从页面源代码自动检索数据
- 隐藏的代码注释,甚至在源代码(HTML / JS)中