在cloudfoundry上进行JSDOM刮擦;不起作用

JSDOM scraping on cloudfoundry doesn't work

本文关键字:刮擦 不起作用 JSDOM cloudfoundry      更新时间:2023-09-26

我正在为一个应用程序使用jsdom node.js模块,该应用程序可以进行一些web抓取以获取所需的一些数据。当我在本地运行时,这非常好。

然而,当我将应用程序推送到cloudfoundry时,它崩溃了。日志如下:

===>/logs/stderr.log<===

/var/vcap/data/dea/apps/caretogethersandbox-0-8b20af9255bbf552d0f490cb60d0df55/app/node_modules/jsdom/lib/jsdom.js:171features=JSON.parse(JSON.stringfy(window.dococument.eximplementation.fea^TypeError:无法读取未定义的属性"implementation"

我这里缺什么了吗?我被难住了。我知道我写的代码运行良好,只是模块和cloudfoundry之间的问题。

我能够很容易地重现这个问题。jsdom似乎依赖于一个名为Contextify的本地编译库(https://github.com/brianmcd/contextify)根据我所能收集到的信息,它还与Python有一些绑定。Cloud Foundry目前不支持这些功能。关于这个问题,Github上也有类似的问题;

https://github.com/tmpvar/jsdom/issues/436

在撰写本文时的最后一篇文章建议使用两个名为Domino和Zepto Node的100%JS库,它们可能值得一看。

只有你发布的内容,几乎不可能给你一个直接的答案。

但我有几个建议。

  1. 环境变量在生产中的作用与在开发中的作用不同。

  2. jsdom依赖于通常从外部加载的jquery。也许jquery加载不正确。

你听说过cheerio吗。它是jsdom的一个替代方案,实现了jquery的一个子集,并且不需要从外部加载jquery。这比jsdom快得多。

您可以观看作者为介绍cheerio而制作的视频,并了解其更多好处。

使用cheerio-github页面上的示例代码,并将其上传到您的cloudfoundry帐户,看看是否一切正常。然后你可以根据天气情况决定换成cheerio。