如何使用gwt从给定的url文档中提取内容?

时间:2012-05-09 10:26:57

标签: javascript gwt web-scraping

我是GWT的新手,正在尝试构建一个网络抓取应用。 我有一个自定义网址,比如www.amazon.com。 我希望能够打开这个URL,从源代码中抓取信息(最好将html内容存储为gwt中的Document)并在控制台上打印已删除的信息。

我尝试在当前页面中创建iframe并将其src设置为自定义网址。但这没有成功。

请告诉我你是否需要我详细阐述/澄清问题的任何方面

谢谢!

1 个答案:

答案 0 :(得分:0)

在服务器上废弃URL并通过servlet写入输出。在GWT的对话框中打开此Servlet URL。

或者如果(报废页面的)内容可以以其他格式(如HashMap)存储,则可以通过RPC服务器获取数据对象并将其显示在客户端的HTML面板中。

谢谢, Sreehari。