我可以't在javascript执行后下载页面.页面的最终版本
I can't download pages after javascript have executed. Final version of page.
我正在抓取网站,但很少有网站因为javascript而无法正确显示。所以我需要scraper,它也可以处理javascript&iframes(类似浏览器),并为我提供页面的最终输出。
我想让这个东西在php上运行,但到目前为止,这似乎是不可能的,因为javascript在客户端执行,但php是服务器端进程。已尝试文件集内容&卷曲也是简单的测试。
所以我在c#中搜索解决方案。发现了硒元素,花了一整天的时间试图弄清楚如何设置一切。遗憾的是,selenium在javascript执行之前也会下载页面。
我越来越累,越来越绝望。有人能给我一些建议吗?
您正在寻找的是所谓的无头浏览器。蟒蛇有一个名字叫机械化:此处
此外,还有HtmlUnit。HtmlUnit是用Java创建的,但可以移植到C#(使用IKVM相当容易)。
以下是关于如何将其移植到C#的信息:如何在C#中使用HtmlUnit
相关文章:
- 如何在生成下载文件时显示加载动画
- 直接下载文件,而不是从window.open(url)
- 如何使用javascript或html下载PDF格式的填写表单
- Javascript运行php文件,然后下载文件
- 在单击href链接的同时下载文件
- 尽管链接成功并已成功下载,但未找到NPM模块
- 通过php页面中的js强制下载txt
- JS编译器/包管理器,用于版本控制
- 下载最新版本的 GitHub 项目的链接
- 如何添加指向 Fancybox 的链接以下载图像的高分辨率版本
- 如何下载具有 Angular2 或更高版本的文件
- 我可以't在javascript执行后下载页面.页面的最终版本
- 使用iron路由器1.0.0-pre2版本下载文件链接
- 如何在IE 9及以上版本的jsp中使用html/javascript强制下载
- 将客户端引导到正确的页面以下载适用于其操作系统版本的IE
- Handlebarsjs:在哪里下载最新版本
- 为什么鲍尔总是下载angular版本的v 1.5.9-build.5086+sha..
- 如何在IE9及更低版本中下载由jszip.js创建的zip文件,而不使用基于flash的下载
- 如何使用v2.2(opentok版本)进行视频录制和下载
- 下载电子游戏/检测电子游戏版本