如何从HTML页面中提取完整的DOM树
Howto extract a complete DOM Tree out of an HTML Page
我必须比较两个网页并分析它们之间是否有任何差异。问题是:我需要包括每个DOM元素(也是那些通过javascript动态添加),我需要包括所有应用的CSS设置(又名。计算风格)。
例如:如果有一个CSS :hover
设置定义,我需要得到一个不同的结果,当我的鼠标在元素上,而不是在元素上。
也许我可以对页面的每个元素进行javascript迭代,询问每个css设置和每个子DOM元素。但是我认为这会花费很长时间,并且会破坏生成的DOM,使比较变得更加困难。
有什么想法?谢谢! !
对于Firefox, XmlSerializer是您的好朋友。
我会检查selenium。有一个命令selenium.getHtmlSource();您可以在javascript函数发生后调用它。快速浏览后,我发现了这个
http://davidlaing.com/2008/12/29/selenium-gotcha-seleniumgethtmlsource-returns-processed-html/和
需要使用Java比较2个html文档&硒
我知道这不是你所希望的优雅的方式,但我希望这能让你开始
相关文章:
- 在提取dom对象后,无法将每个名为tab的元素推送到数组中
- 将特定深度的innerHTML提取到DOM树结构中
- 使用Javascript从DOM中提取所有图像
- 如果我知道XPATH,如何使用JavaScript从DOM中提取Element值
- 在DOM中查找和提取文本
- 从几乎相同的dom结构中提取内部文本
- 从DOM中提取字符串时,会对其进行不同的处理
- 从$.get()中提取DOM内容作为jQuery对象
- 使用DOM从第二个HTML表中提取数据,忽略第一个表
- 如何在dom-node上获取和提取匹配的css规则
- 使用DOM从动态html表中提取数据
- 使用DOM从XML中提取信息
- 如何从HTML页面中提取完整的DOM树
- 操作DOM元素以提取一些节点并删除其他节点
- 如何提取保存到DOM的四方形access_token作为链接,以便将其用于API调用
- 如何提取保存到DOM的四方形access_token作为链接,以便将其用于API调用
- 从 DOM 保留换行符中提取无格式文本的最佳方法
- 如何为javascript生成的DOM对象提取html代码
- 在jQuery中从DOM中提取多个数据
- 识别和提取网页中呈现的DOM