我如何从一个无限滚动的网站抓取图像,其中api是隐藏的,我无法通过使用Inspect Element获得它->网络
How do i crawl images from a website of infinite scrolling where the api is hidden and i cant get it from by using Inspect Element->Network
我正试图抓取一个具有无限滚动功能的网页。所以我只能得到图像,直到第一次加载,不能再得到它们。我甚至试图找到从InspectElement->Network加载图像的ajax应用程序调用。但发现它并没有进行任何ajax调用,但图像仍在加载中。
有没有办法隐藏为获取这些图像而发出的获取请求?
您可以使用像PhantomJS这样的无头浏览器,并提取其中的DOM节点。如果需要,您可以使用标准的DOM API,甚至jQuery。
var page = require('webpage').create();
page.open('http://www.sample.com', function() {
page.includeJs("http://ajax.googleapis.com/ajax/libs/jquery/1.6.1/jquery.min.js", function() {
page.evaluate(function() {
console.log($(".yourimgclass"))
});
phantom.exit()
});
});
当然,你可以告诉PhantomJS,向下滚动。
相关文章:
- jQuery:.click(function(){(element),collapse('show',f
- delete在Object上效率低下,但在DOM Element's的数据属性,与null out相比
- Javascript - element.childNodes does not see an append.newch
- 使用element简化onclick函数
- AngularJS,angular.element($0).scope()揭示了每个控制器的函数
- 如何使用element.myobj.prop等具有对象属性的元素
- element.dataset in Internet Explorer
- Protractor:element.getText()返回一个对象,而不是String
- jQuery event.target is_a_child_of(element)
- 如何获得'{element:}'价值
- ng模型在$(element).clone()之后不起作用
- jquery selector on some element
- 将setTimeout()包装器实现为Element.prototype中的方法
- 我如何从一个无限滚动的网站抓取图像,其中api是隐藏的,我无法通过使用Inspect Element获得它->网络
- 如何在Chrome Inspect Element中找到生成资源的源代码
- 在Chrome's Inspect Element中检查DIV后面的JavaScript
- 在Inspect Element Editor中修改JS代码
- 元素不会显示在页面的源代码中,但会显示在“inspect element”中
- DOM更新没有显示在'View Source'中,只显示在'Inspect Element
- (非远程)home Dev Tools ("Inspect element")在Android上等效