VBA加载网页并提取内存中的数据
VBA load webpage and pull data in memory
如果我只是想看看这是否可能。因此,对于任何网站,如果我想从网站的另一个页面提取源代码(加载它等),而不去实际的网页,这可能吗?例如,这可以在内存中完成吗?例如,如果我有一个像cnn.com这样的网站,而不是真正点击文章链接并转到该页面,如果我只想从该页面提取信息,但仍停留在主页上,这可能吗?如果可能的话,我该怎么做呢?谢谢你的帮助。
我不知道你说的不去网页就拉源代码是什么意思。同样,你说"在记忆中"这样做是什么意思?每个应用程序都在RAM中运行,内存计算的不同之处仅在于您将整个数据库保存在内存中,而不不时将表/列的位加载到内存中。请提供一些澄清。
模拟浏览
您可以使用"InternetExplorer.Application"对象加载网页并"留在页面上":(http://www.analystcave.com/web-scraping-tutorial/#Excel_IE_Object)。
这将在后台打开谷歌。
Set IE = CreateObject("InternetExplorer.Application")
IE.Visible = False
IE.Navigate "http://www.google.com/"
Do While IE.Busy 'We need to wait until the page has loaded
Application.Wait DateAdd("s", 1, Now)
Loop
加载HTML页面(无浏览器)
这将显示没有浏览器作为代理的网页的HTML:
Set XMLHTTP = CreateObject("MSXML2.serverXMLHTTP")
XMLHTTP.Open "GET", "http://www.google.com", False
XMLHTTP.setRequestHeader "Content-Type", "text/xml"
XMLHTTP.send
MsgBox XMLHTTP.ResponseText
(http://www.analystcave.com/web-scraping-tutorial/#XMLHttpRequest_object)
相关文章:
- VBA加载网页并提取内存中的数据
- 将所有angular2捆绑包包含在index.html中会使导入从内存获取数据,而不是再次从服务器请求数据
- 如何在浏览器中触发另存为对话框,以便可以在内存中保存 json 数据
- 我应该如何在Node中管理内存中的数据
- 如何确保我的谷歌图表数据在Javascript中从内存中删除
- 在 KnockoutJS 中更改模型数据时出现 Javascript 内存泄漏
- 在 Emscripten'd C++ 程序中处理数据后,如何修复尝试从 Web worker 发回数据时的“内存不足”错
- 可以在恒定内存中对低维数据进行聚类
- 使用数据URI快速更新图像会导致缓存、内存泄漏
- javascript/nodejs:在大的、分块的数据集上同步调用一组类似的异步函数会导致内存泄漏
- 在appcelerator titanium中进行数据绑定并避免内存崩溃的最佳做法是什么
- NodeJS:你可以使用普通的Javascript对象作为内存中的数据存储吗
- 具有重复jQuery数据表AJAX调用的内存管理
- 在浏览器内存中加载的最大数据量
- Javascript中的内存布局——面向数据vs面向对象设计
- 在Javascript中转换图像到内存流数据
- 从用户那里收集JavaScript内存配置文件数据
- 是否有一个HTML5的方法显示tiff图像数据已经加载到内存
- jQuery.数据导致内存泄漏
- 有没有工具可以查看IE浏览器的内存数据,比如javascript数据