从谷歌搜索结果java中提取网址

时间:2012-06-19 08:33:04

标签: java web-crawler

  

可能重复:
  How can you search Google Programmatically Java API

我需要使用Java在Google搜索结果中提取网址。我做的第一步是使用一个代码来提取整个html页面文本。

不幸的是,此代码不适用于谷歌。有没有解决方案使用java代码从谷歌搜索结果页面中提取网址?我读过谷歌自定义搜索API。我的问题是:是否有可能与Java一起使用?有线索吗?

URL url = new URL("http://type the search result url here");
URLConnection connection = url.openConnection();
connection.setDoInput(true);
InputStream inStream = connection.getInputStream();
BufferedReader input =
new BufferedReader(new InputStreamReader(inStream));
String line = "";
while ((line = input.readLine()) != null)
System.out.println(line); </i>

1 个答案:

答案 0 :(得分:0)

如果你想要一个爬虫,你也可以尝试Selenium: http://seleniumhq.org/download