使用[jsdom+qs]抓取html
Scraping html using [jsdom + qs]
我是使用jsdom和querystring的新手。我试图在所有iframe html标签中为所有的soundcloud track_id
抓取一个页面。下面的代码记录了undefined
,因为第一个iframe不是声音云播放器。
我如何…
- 修改代码以检索所有iframe实例
-
使用jsdom/qs检查是否存在
http://w.soundcloud.com/player/?url=http%3A%2F%2Fapi.soundcloud.com%2Ftracks%2F
或仅存在soundcloud
。(我可以使用if字符串包含js测试的字符串类型,但我认为使用jsdom/qs有更好的方法)。jsdom.env({ html: 'A_URL', scripts: [ 'http://code.jquery.com/jquery-1.5.min.js' ], done: function(errors, window) { var $ = window.$; var src = $('iframe').attr('src'); var aRes = qs.parse(decodeURIComponent(url.parse(src).query)).url.split('/'); var track_id = aRes[aRes.length-1]; console.log("track_id =", track_id); } });
$('iframe').each(function(index, element) {
if (element.attr['src'].match(/soundcloud/)) {
// do your stuff
return false; // if there's only one relevant iframe
}
}
相关文章:
- VBA正在抓取不在HTML源文件中的生成内容
- Html抓取网站加载错误的J汤Java
- 使用[jsdom+qs]抓取html
- 节点.js在抓取 HTML 时返回 null
- 在Cheerio中抓取HTML表格
- 使用 web-harvest 抓取 HTML 文件中的 javascript 变量
- 使用JQuery抓取HTML元素
- 从另一个页面抓取HTML
- 抓取html并将其显示在另一个网站上
- 在jQuery中提交页面之前抓取HTML
- 使用Intel XDK抓取HTML源代码
- 使用javascript抓取html中的javascript/cdata
- 抓取HTML标签值并分配给PHP变量
- 用request/cheerio抓取html到js对象中
- jQuery:有没有一种方法可以抓取HTML元素的外部CSS并附加到它的“style”上?属性
- 从gmail抓取html表格,并使用谷歌应用程序脚本放入谷歌表格
- JavaScript函数同步抓取HTML和JS
- 通过潜入js源代码来解决抓取HTML的问题
- 是否有可能自动抓取HTML上的所有FORM变量和值到Javascript中?
- 如何以安全可靠的方式抓取HTML元素的文本