使用ruby (clojure或javascript)保存进入的网页

save entere webpage using ruby (clojure or javascript)

本文关键字:保存 网页 javascript ruby clojure 使用      更新时间:2023-09-26

我遇到了一个问题。我正在与食品供应商工作,我需要保存每个订单的内容为html。订单作为链接列在单个页面上,但这有两个困难

  1. 页面使用认证(需要提前登录我)
  2. 这是真正的问题:页面使用了很多javascript。实际上,一切都可以在不改变网址的情况下工作,所以我不能使用wget或rio gem (url不像www.fooddoe.com/order, www.fooddoe.com/order/1等,但总是像www.fooddoe.com/suplierx)。

我认为firewatir将是一个很好的选择,但问题是,我需要保存的页面格式类似于html(包括图像)。有可能使用firefire吗?clojure或javascript中还有其他选择吗?

非常感谢!

我把你的问题读了两遍才明白你的意思。

从web地址从例子中我假设这是你的供应商网页。所以我认为最简单的方法是:

  1. 查看网页的来源,以了解它如何获得数据(99%的AJAX请求)。
  2. 请求转到响应它的服务器。
  3. 现在有两种方法:
    • 了解如何发出请求并编写和应用程序来发出这样的请求并使用它生成网页(更困难,更通用)
    • 联系供应商获取原始数据库(简单但一次性解决方案)

我认为这不是任何语言所特有的问题