如何使用由Javascript填充的Python从网站获取数据
How to fetch data from a website using Python that is being populated by Javascript?
我想从网站上获取一些数据/值。我使用了beautifulsoup
,当我试图从Python脚本中获取字段时,这些字段是空白的,而当我检查网页的元素时,我可以清楚地看到表行数据中的值是可用的。当我看到HTML源代码时,我注意到它也是空白的。我想出了一个原因,该网站使用Javascript
从自己的数据库中填充相应字段中的值。如果是,那么我如何使用Python获取它们?
Selenium和phatomjs的Python绑定(如果您想使用无头浏览器作为后端)是适合此工作的工具。
是的,你可以抓取JS数据,只需要更多的黑客攻击。浏览器可以做的任何事情,python都可以。
如果您使用的是firebug,请查看network
选项卡,查看数据来自哪个特定请求。在铬元素检查中,您也可以在名为network
的选项卡中找到这些信息。只需点击ctrl-F即可搜索请求的响应内容。
如果你找到了正确的请求,数据可能会嵌入JS代码中,在这种情况下,你需要进行一些regex解析。如果幸运的话,格式是xml或json,在这种情形下,你可以使用相关的内置解析器。
相关文章:
- 如何使用由Javascript填充的Python从网站获取数据
- 从外部网站获取JSON数据
- 如何从网站获取数据,然后显示在英特尔 XDK 页面中
- 从外部网站获取谷歌地图数据
- 从安全网站获取特定数据
- 如何从网站获取所有图像并用base64编码替换它们
- 从网站获取特定文本 (html)
- 如何从动态网站获取完整的网址
- 从网站获取 jquery 动态值
- 从网站获取数据
- 使用 XMLHttpRequest 从另一个网站获取单词
- 使用 javascript 从网站获取所有出站链接
- 从填充了 JavaScript 的网站获取内容
- 如何从另一个网站获取访问者数量
- 如何从其他网站获取信息
- 如何使用 jsPDF 和 HTML2Canvas 从网站获取多页 PDF
- 如何从图像托管网站获取相册图像并将其自动显示在网站中
- 使用客户端脚本从远程网站获取所有 HTML
- 如何从其他网站获取内容
- 如何使用javascript从网站获取数据表