如何使用python在网页上提取动态时间计数器
How to extract dynamic time counter on a web page using python
我正在python中使用BeautifulSoup
抓取一些网站。我在一个网站上偶然发现了一个倒计时计时器,我想提取它。计时器显示网站上某些信息的剩余时间。某些javascript方法每秒触发innerHTML
。有人知道怎么提取吗?
我不知道你为什么要截屏,因为大量免费的Javascript倒计时代码只需要谷歌搜索。这是我最喜欢的罗伯特·哈希米安的作品:http://www.hashemian.com/tools/javascript-countdown.htm
但是,如果你仍然想抓取它,你需要查看网站的HTML源代码。如果计时器的javascript嵌入到文档中,则必须找到开始和结束的<script>
和</script>
标记,并复制其间的所有内容(这基本上消除了自动抓取的问题,因为无论如何都必须查找脚本)。如果脚本在外部js文件中(更有可能),最好只下载该文件。
相关文章:
- 当数据从excel表中提取时,我想使用动态进度条
- 如何添加动态Id's并在运行时提取它们
- 用于提取基于点概念的变量的动态Regex
- 我正在尝试从 xhtml 文件中动态提取所有
元素,并使用 javascript 将它们放入选择列表中
- 如何在单击按钮后提取javascript中textarea的id(在本例中是动态的)
- 从动态复选框的父级中提取类名
- 从动态页面中提取 html 源代码
- 使用 node.js 和 PhantomJS 提取动态内容
- 使用Javascript提取外部动态链接
- 如何使用jQuery提取动态加载的胡子模板的一部分
- 如何使用python在网页上提取动态时间计数器
- 我的ajax调用没有从PHP/Mysql中提取动态数据
- 从H2提取特定信息,编辑并删除图像中的一些动态值
- 如何使用d3.js从json文件中提取数据来绘制动态图
- 如何从网页中提取javascript动态数据
- AngularJS指令能否从动态内容中提取类名
- 如何使用selenium提取工具提示内容,其中工具提示是由javascript动态加载的
- 从动态网页中提取文本
- 使用DOM从动态html表中提取数据
- 如何提取动态生成元素的id