VBA正在抓取不在HTML源文件中的生成内容
VBA scraping generated content which is not in the HTML source file
我制作了一个VBA代码来从网页上获取一些产品价格。
我可以让它为所有我想要的网站工作,除了一个。在这个特定的网站上,价格没有显示在页面的HTML代码中,但据我在网上搜索时所知,它们是由JavaScript本地生成的。
我怎样才能勉强买到这些价格?
我使用这种方法来获取页面来源,然后解析响应文本以获得我需要的信息,如产品名称和链接,但我无法获得价格:
Set xhr = New MSXML2.XMLHTTP60
adresa = "http://www.elefant.ro/carti/natura"
With xhr
.Open "GET", adresa, False
.send
If .readyState = 4 And .Status = 200 Then
Set doc = New MSHTML.HTMLDocument
corp = .responseText
Else
Cells(i, 2) = "error"
End If
End With
这是我得到的页面的HTML代码的一部分,价格应该在哪里:
<div class="js_PriceContainer" style="display: none">
<div>
<div class="product_old_price js_oldPrice">
<a class="FFTracking" rel="" href="/carti/natura/resurse-naturale/ghidul-culegatorului-de-ciuperci-211009.html"><span class="js_basePrice"></span> lei</a>
</div>
<div class="product_discount js_ProductDiscount">
<a class="FFTracking" rel="" href="/carti/natura/resurse-naturale/ghidul-culegatorului-de-ciuperci-211009.html">(<span class="js_discount"></span>%)</a>
</div>
</div>
<!-- <div class="promo_bf">
<div class="product_old_price"></div>
<div class="product_discount"></div>
</div> -->
<div style="clear:both"></div>
<div class="product_final_price js_FinalPriceContainer">
<a class="FFTracking" rel="" href="/carti/natura/resurse-naturale/ghidul-culegatorului-de-ciuperci-211009.html">
<span class="js_finalPrice js_promoNonBf"></span>
<span class="js_finalPrice js_promoBf"></span>
</a>
</div>
</div>
请帮忙!谢谢
在项目中导入QT WebKit,并在抓取之前使用WebKit的强大功能来渲染网页。本指南解释了如何在LXMLscraper中实现webkit。
相关文章:
- 同源策略目的|用户数据与基本页面数据|客户端页面抓取
- VBA正在抓取不在HTML源文件中的生成内容
- 尝试使用Node.js动态路由从IMDB中抓取电影内容.但是在我的output.json文件中没有定义
- 如何从网站上抓取链接和图片
- 用jquery抓取图像SRC-attr
- Javascript Regex-从价格中抓取分隔符
- 使用网络服务器的IP地址而不是域名对其进行屏幕抓取
- Javascript:如何从URL中抓取片段并将其写入一些PHP
- 使用htmlunit抓取动态网页
- 如何抓取URL的一部分并将其粘贴到页面上的某个位置
- Html抓取网站加载错误的J汤Java
- 如何获取网站所有页面的链接以进行数据抓取
- 如何使用AJAX和JSON从一个页面抓取PHP变量到另一个页面
- 我可以使用RubyonRails抓取URL的源代码吗?还是应该使用PHP
- 我如何从一个无限滚动的网站抓取图像,其中api是隐藏的,我无法通过使用Inspect Element获得它->网络
- 淘汰从选项中抓取类
- 在Python中抓取javascript渲染的文本的最快解决方案
- 什么是处理JavaScript的最简单的网络抓取工具
- 使用 jQuery 从选择标签中抓取文本
- 无法在 IE 7/8 中使用 parentNode 抓取 DOM 节点