解析当前页面的html

Parse html of current page

本文关键字:html 当前页      更新时间:2023-09-26

我想制作一个脚本,将解析当前页面的html,过滤掉某些div类,现在将其内容写入文件或删除页面上的其他所有内容。

我想最好的方法是在那个页面上运行一个Tampermonkey脚本。我看了http://userscripts-mirror.org/,但没有找到这样的脚本。

是否有一个javascript html解析器,可以在chrome上运行?

可能是这样的?

 var divClasses = parseCurrentPage("div class x");
 // then do something on divClasses and then show only them

Jquery可以完成所有这些,甚至更多。我建议大家仔细阅读https://learn.jquery.com/

一旦你包含了jquery一个简单的抓取所有"div"元素选择器将是这样的:var divClasses = $('div');如果您只想抓取某些div元素,可以使用选择器轻松地做到这一点,可以通过向选择器添加类、id和/或父/层次结构级别的限制来实现—在这里阅读更多内容https://api.jquery.com/category/selectors/

当你在div元素上做了你想做的事情之后,你可以再次使用jquery,只使用jquery的'append'函数来显示它们。

简单地调用'append'函数与div元素你想要添加到父html元素$('selector-to-grap-div''s-parent-html').append(myDiv);如果你需要获取一个div元素的父元素,那么你可以使用jquery的'parent'函数

过滤掉某些div类

可以使用document.getElementsByClassName()

var elements = document.getElementsByClassName(names); // or:
var elements = rootElement.getElementsByClassName(names);
  • elements是已发现元素的活HTMLCollection
  • names是一个字符串,表示要匹配的类名列表;类名之间用空格分隔
  • getElementsByClassName可以在任何元素上调用,而不仅仅是在文档上。调用它的元素将被用作根

我相信你可以用jQuery让它变得简单…只需获取<body>的内容,并使用jquery进行查询。