提取网页的源代码
extracting source code of a webpage
嗨,我想提取一个外部网站(不在我的域上)的源代码,然后解析它,使其成为一个应用程序。我知道如何使用JAVA的Jsoup库,但我找不到任何关于如何使用Javascript、Jquery或任何客户端web编程语言的链接。有人能告诉我该用哪个图书馆吗。基本上,我想获得网页的HTML源代码,然后对其进行解析,以提取某些标签下的某些链接。
由于同源策略,您将无法单独使用JavaScript执行此操作。这将阻止您从其他域读取信息。
您需要做的是使用服务器端代理来获取信息。Ajax调用可以调用代理来获取页面。
相关文章:
- 来自网页的Javascript源代码
- 提取网页的源代码
- 如何从网页获取源代码
- Chrome 调试不会重新加载网页源代码
- 如何以编程方式下载网页的所有内容,而不仅仅是Java中的源代码
- 如何下载网页的确切源代码
- 如何使用R查看网页源代码
- 获取同一网络中网页的源代码
- 如何制作从网页复制HTML源代码的AppleScript
- 在Java中获取网页源代码
- 当你将HTML源代码复制到记事本中的.HTML文件中时,网页会发生什么?
- 使用谷歌浏览器时,什么类型的HTML, javascript或网页源代码会导致Adblock不呈现页面?
- 获取网页源代码后,网页运行Javascript - Java
- 需要在我的网页上显示语法突出显示的源代码
- 如何在JavaScript更改DOM后以编程方式读取网页的源代码
- 外部网页的HTML源代码为字符串
- 什么'用python下载网页源代码的最简单方法是什么?(在应用javascript之后)
- Greasemonkey 替换了网页中的 unityObject 源代码
- 从源代码中没有的网页中提取数据
- 如何下载带有 JavaScript 创建的标签的网页的源代码