可能从另一个域中提取数据

Extracting Data from Another Domain, possible?

本文关键字:提取 数据 另一个      更新时间:2023-09-26

我不擅长记录我的账单,所以我想创建一些自动化的东西。我也想挑战一下,亲自制作。

我的问题:

是否有可能有一个网页连接到另一个域(任何公用事业网站,即timewarnercable.com)与适当的登录凭据和检索我欠的美元金额,然后给我发一封电子邮件,甚至只是在网页上显示它?

我已经有一个网页设置,有我所有的帐户信息存储在它(不要担心它只是一个本地网站!),我可以点击一个按钮,我存储的信息发送一个POST请求到实用程序登录网站。这样我就可以登录到我的账户页面,然后我就可以查看账单了。但不想再翻开新的一页…我宁愿在后台加载该页面的内容,扫描显示my $欠款的代码,然后以某种方式捕获它,然后将美元金额返回到网页上。

如果是这样,是否可以用Ruby (Rails)或php, Javascript/AJAX来设计?

谢谢!

你基本上问的是"页面抓取",但你的场景更复杂。您必须伪造登录帖子,捕获并存储响应中返回给您的任何cookie/会话信息,并在随后的站点请求中使用这些信息。您可能还需要处理重定向,这取决于站点。我发现nodejs实际上对抓取页面非常有用,因为它有提供dom选择器的插件(有一个jquery插件)-你正在使用javascript进行服务器端编程。检查网站是否有API,如果网站提供了,将使您的生活更容易。像美国银行这样的一些银行已经有这样的应用程序了——他们从其他网站收集你的账户和账单,看看你的银行是否能做到这一点。