识别具有动态内容的网页
Identify a webpage has dynamic content
我用python编写代码,对html、mysql、javascript或其他数据库类型的语言知之甚少。
我正在使用pythonsurllib模块来检索web源代码,我想知道是否有一种方法可以识别网页是否具有动态内容。我所说的动态内容是指,任何自主的更改源代码都不是源于用户输入。例如,如果该网页上的广告每10分钟更改一次。即使我两次加载页面并比较源代码,它也不会发现页面实际上是动态的。我很想知道在源代码中是否有任何"关键字"可以用来识别网页是否使用了动态内容
感谢
更新:
我并不声称对javascript一无所知,但我在一个页面中发现了以下代码,我知道这些代码是动态的,但通常不会透露出来:
document.write('<script language="JavaScript" src="http://ad.doubleclick.net...
document.write
是识别动态页面的好关键字吗
这是一件非常困难的事情。基本上,你会寻找ajax请求,看看它会把你带到哪里。如果你想解析动态内容,你必须使用javascript解释器或类似浏览器的加载类型。我看不到其他解决方案。
祝你好运。
相关文章:
- 如何在不重新加载整个网页的情况下动态更改经度和纬度的值
- I'我试图在我的网页上动态地上下移动元素.我该怎么做
- Matplotlib;动态网页
- 使用htmlunit抓取动态网页
- 从脚本中的动态(javascript)网页获取信息
- 如何使用javascript在asp.net网页表单上动态添加文本框
- 如何为动态网页创建谷歌放大器
- .val() 选择文本而不是值字符串,当网页动态编辑源 html
- 使用 jQuery 将文本框动态添加到网页
- 使用 HTML5<输入>字段抓取动态生成的网页
- 动态网页的SEO
- 在不增加分析跳出率的情况下,绑定网页上的内部链接以动态加载
- 从动态生成的列表在PHP网页之间传递数据
- 使用javascript/jquery从网页中获取动态更改的数据
- 动态网页的快捷方式
- 动态创建的网页不起作用
- 在网页上动态更改图像,而无需先将它们存储在服务器中[Javascript/Jquery - Spring]
- 动态突出显示(更改背景)/网页中的内容
- 使用用户脚本记录网页动态创建的标记属性
- 使用用户脚本记录网页动态创建的 DOM 元素