如何使用 gwt 从给定 URL 的文档中提取内容

How to extract content from a given url's document using gwt?

本文关键字:文档 提取 URL gwt 何使用      更新时间:2023-09-26

我是GWT的新手,正在尝试构建一个网络抓取应用程序。我有一个自定义网址,比如 www.amazon.com。我希望能够打开此 url,从其源中抓取信息(最好通过将 html 内容存储为 gwt 中的文档)并在控制台上打印抓取的信息。

我尝试在当前页面中创建 iframe 并将其 src 设置为自定义 url。但这并没有成功。

如果您需要我详细说明/澄清问题的任何方面,请告诉我

谢谢!

废弃服务器上的 URL 并通过 servlet 写入输出。在 GWT 的对话框中打开此 Servlet URL。

或者,如果(报废页面的)内容可以以其他格式(如 HashMap)存储,那么您可以对服务器进行 RPC 以获取数据对象并将其显示在客户端的 HTML 面板中。

谢谢斯里哈里。