应用错误收集

如何使用gwt从给定的url文档中提取内容？

时间：2012-05-09 10:26:57

标签： javascript gwt web-scraping

我是GWT的新手，正在尝试构建一个网络抓取应用。我有一个自定义网址，比如www.amazon.com。我希望能够打开这个URL，从源代码中抓取信息（最好将html内容存储为gwt中的Document）并在控制台上打印已删除的信息。

我尝试在当前页面中创建iframe并将其src设置为自定义网址。但这没有成功。

请告诉我你是否需要我详细阐述/澄清问题的任何方面

谢谢！

1 个答案:

答案 0 :(得分：0)

在服务器上废弃URL并通过servlet写入输出。在GWT的对话框中打开此Servlet URL。

或者如果（报废页面的）内容可以以其他格式（如HashMap）存储，则可以通过RPC服务器获取数据对象并将其显示在客户端的HTML面板中。

谢谢， Sreehari。