如何从url中检索HTML结构数据,并使用javascript分析DOM特定数据

how to retrieve HTML structure data from a url and analyse DOM specific data using javascript

本文关键字:数据 javascript 分析 DOM url 检索 HTML 结构      更新时间:2023-09-26

我正在做一个chrome扩展。

这个扩展将查询搜索引擎,并获得每个关键字输出在HTML表格式。

检索HTML文档后,JS将分析HTML DOM,并获得指定的数据,然后将数据显示在定义的选项卡中。

我研究了stackOverflow。

  1. 我如何从javascript的url检索html文档?这一个,导致chrome扩展没有原点问题,它可以访问任何域名。
  2. 如何使用简单的html dom解析器从抓取中抓取特定数据这个,我不需要用PHP编写。

我需要JavaScript解决方案。

经过2天的研究,我有了一个使用jQuery解决这个问题的草案计划。

但我怀疑这是否是解决这个问题的最佳方案。

问题是:

1)使用Javascript请求url;2)使用Javascript获取响应数据,并将数据保存到一个变量或一些临时文件中;3)使用Javascript从步骤2中检索特定数据,例如特定的tag_id或类名称标签元素。
4)在Chrome浏览器中使用Javascript将数据写入当前聚焦的网页标签页。

你的意思是http://api.jquery.com/jQuery.get/

$.get("http://www.whatismyip.com/", function(response) {
     console.log ("Hey I found out " + $(response).find("#ip").text());
    });

这可能解决了1),2)和3),如果你绕过访问控制允许原点问题(也许通过在你的服务器上有一个代理,允许在其访问控制允许原点的所有域。

至于4)你可以注入任意javascript到任何加载的页面,当你是一个chrome扩展,文档在这里http://code.google.com/chrome/extensions/tabs.html

这个jsFiddle演示了如何从url获取一些数据并提取其中的一部分。这就是你想要的吗?

$.get('/').success(function(data){
    $(data).find('#home').appendTo('div');
});