使用ruby (clojure或javascript)保存进入的网页
save entere webpage using ruby (clojure or javascript)
我遇到了一个问题。我正在与食品供应商工作,我需要保存每个订单的内容为html。订单作为链接列在单个页面上,但这有两个困难
- 页面使用认证(需要提前登录我)
- 这是真正的问题:页面使用了很多javascript。实际上,一切都可以在不改变网址的情况下工作,所以我不能使用wget或rio gem (url不像
www.fooddoe.com/order
,www.fooddoe.com/order/1
等,但总是像www.fooddoe.com/suplierx
)。
我认为firewatir将是一个很好的选择,但问题是,我需要保存的页面格式类似于html(包括图像)。有可能使用firefire吗?clojure或javascript中还有其他选择吗?
非常感谢!
我把你的问题读了两遍才明白你的意思。
从web地址从例子中我假设这是你的供应商网页。所以我认为最简单的方法是:
- 查看网页的来源,以了解它如何获得数据(99%的AJAX请求)。
- 请求转到响应它的服务器。
- 现在有两种方法:
- 了解如何发出请求并编写和应用程序来发出这样的请求并使用它生成网页(更困难,更通用)
- 联系供应商获取原始数据库(简单但一次性解决方案)
我认为这不是任何语言所特有的问题
相关文章:
- 永久保存网页的所有效果
- 如何使用javascript保存网页
- "无法保存此网页“;Internet Explorer 8中出现错误
- 编辑网页并在本地保存更改
- 使用JS将网页直接保存为PDF
- 如何在不编码或保存数据的情况下将二进制数据从javascript传递到actionscript(网页到flash)
- 使用java脚本通过网页保存Excel文件
- AppleScript 从网页特定部分的 URL 保存文档
- 用于检测用户何时保存网页的 Javascript
- 将网页转换为PDF并将其保存在服务器中 - JS或PHP
- 保存网页以供在 Web 应用程序中脱机访问
- 将从网页中的网络摄像头拍摄的图片保存到本地文件夹
- 用于检索、保存和存储信息的内部网页
- 正在保存网页设置配置
- 使用socket.io保存网页状态
- 保存网页与Javascript/jQuery的变化
- 用Firefox插件保存网页,使用file ->保存为弹出窗口
- 如何保存网页,以便可以重新加载并再次使用
- 允许用户在HTML中更改和保存网页上的背景图像
- 如何保存网页的所有样式和图像类似于evernote