Google Api,Java,从网页上读取数据

时间:2013-10-30 06:38:45

标签: java api

任何人都可以帮我阅读谷歌网页上的数据。例如:我想使用Java阅读链接下方的作者姓名,以及右侧的PDF或HTML链接到我的数据库。

请在此处找到链接:

http://scholar.google.com/scholar?hl=en&q=visualization&btnG=&as_sdt=1%2C4&as_sdtp=

1 个答案:

答案 0 :(得分:0)

您要问的是数据提取。您需要加载HTML页面,然后从HTML中逻辑选择信息。

首先使用HTML解析器阅读HTML页面,然后查找Google如何设置其学者链接的模式。您可能会发现事物列在无序列表中,或者某些元素可能具有可用于提取所需数据的标识标记或类。