Jsdom如何从网站抓取信息
Jsdom how to scrape information from website
我正在尝试从这个站点获取信息并将其添加到 json 中,但我不知道具体如何(我尝试了很多教程,但没有成功)。
我想要的信息是:
名人:---
Aniversário: ---
游击队/UF: ---
电话:---
传真:---
立法者:---
我的代码:
function dataDep(arrayDep) {
var urlFormatted = "http://www.camara.leg.br/internet/deputado/" + arrayDep;
jsdom.env({
url: urlFormatted,
scripts: ["http://code.jquery.com/jquery.js"],
done: function(errors, window) {
var $s = window.$;
var depObj = {};
$s('a').each(function() {
//console.log(window);
//console.log($s("title").text());
//console.log($s(this).attr('a'));
//});
// var content = $(".documentFirstHeading");
// console.log(content);
}
});
}
使用 cheerio 和请求模块来加载和解析页面数据Cheerio的工作方式类似于jQuery,但在后端
您可能会遇到一些问题,例如帖子中的页面没有用于识别数据的类或 ID。
但是我发现了一个可能对你有好处的API:http://www2.camara.leg.br/transparencia/dados-abertos/dados-abertos-legislativo
相关文章:
- 同源策略目的|用户数据与基本页面数据|客户端页面抓取
- VBA正在抓取不在HTML源文件中的生成内容
- 尝试使用Node.js动态路由从IMDB中抓取电影内容.但是在我的output.json文件中没有定义
- 如何从网站上抓取链接和图片
- 用jquery抓取图像SRC-attr
- Javascript Regex-从价格中抓取分隔符
- 使用网络服务器的IP地址而不是域名对其进行屏幕抓取
- Javascript:如何从URL中抓取片段并将其写入一些PHP
- 使用htmlunit抓取动态网页
- 如何抓取URL的一部分并将其粘贴到页面上的某个位置
- Html抓取网站加载错误的J汤Java
- 如何获取网站所有页面的链接以进行数据抓取
- 如何使用AJAX和JSON从一个页面抓取PHP变量到另一个页面
- 我可以使用RubyonRails抓取URL的源代码吗?还是应该使用PHP
- 我如何从一个无限滚动的网站抓取图像,其中api是隐藏的,我无法通过使用Inspect Element获得它->网络
- Jsdom如何从网站抓取信息
- 运行代码以在Android应用程序中单击javascript按钮?尝试在页面上抓取回复按钮联系信息 craigslist
- 试图从X射线抓取中获取信息
- 使用Javascript从元数据中抓取信息
- 使用jquery load和php从外部网站抓取信息