Can请求python库强制一个页面在存储该页的内容之前加载所有javascript动态内容
can requests python library force a page to load all javascript dynamic content before storing the contents of that page
Beautifulsoup通常可以用于(1)将页面的内容存储在变量和中(2)解析网页中的元素
然而,Beautifulsoup自己无法打开-密码保护的HTTP错误403页。所以我使用请求来完成这个任务。
现在我想知道请求库是否有能力强制页面上的javascript加载?
我使用python2.7
请求是否有能力发送请求。打开(一些url) .forceJavascriptLoad
No。请求不具备以任何方式执行javascript的能力。你需要一个所谓的"无头"网络浏览器来做你想做的事情。以下是其中的一些。作为一个建议,我建议你尝试一下PhantomJS,虽然它不是用Python编写的,但它比其他的有几个优点:
- 易于设置和使用
- 积极开发,不像许多其他无头浏览器那样被抛弃
- 有很好的JavaScript支持
- 快
- 提供预编译的二进制文件,以防你在编译时遇到问题
我自己尝试了很多无头浏览器,我只对PhantomJS感到满意。如果你仍然想尝试基于python的无头浏览器,你可以给Ghost一个尝试。
相关文章:
- 如何使Javascript动态html表及其上的事件
- 使用JavaScript动态插入DIV的成本有多高
- Javascript动态变量(添加了随机数)
- JavaScript-动态SVG-onload属性-未触发事件
- 传递给 PHP 表单时 JavaScript 动态变量上的未定义索引
- 如何在没有ajax的情况下将javascript动态数据发送到php变量
- 使用javascript动态创建html内容/元素
- 带有多个答案选项的Javascript动态数组窗口
- JavaScript:动态扩展原型是一种糟糕的做法
- Javascript+动态菜单+当前链接样式(CSS)+基于PHP的网站
- javascript动态内容与选择长运行脚本
- Javascript:动态更改CSS文件+Cookie
- 使用javascript动态计算top属性
- 使用javascript动态选择幻灯片放映的图像
- 如何访问用javascript动态生成的textarea的文本内容
- Javascript动态表,每个单元格都有一个onmouse事件
- Php,Javascript-动态表单id's和动态验证
- JavaScript动态附加到搜索字段
- 如何将CSRF令牌添加到javascript动态生成的表单中
- 从Javascript动态构建JSON对象列表