抓取GWT中的网页内容

时间:2010-01-21 14:07:55

标签: gwt

假设我有一个指向包含某些文字的网页的链接。抓取此文本进行处理的最简单方法是什么?

感谢。

2 个答案:

答案 0 :(得分:4)

长话短说,我不认为可以从客户端js请求从具有不同域的URL获取文本。

可以发出加载json的请求。 This link描述了如何。

基本上,步骤是:

  • 在GWT页面中嵌入标签
  • 初始化GWT页面后,更新 脚本标签的src加载远程 网址
  • remote url返回一些json数据 在回调javascript中填充 功能如: 回调({嗒嗒:FOO})

所以,你只有选择可能是在服务器端编写一个加载url的方法,获取文本。然后,您可以使用常规rpc技术从gwt客户端调用此方法。

答案 1 :(得分:1)

假设相同的来源:使用"RequestBuilder" class

如果您尝试从其他来源抓取网页,那么它显然无效。