我需要从网页中提取主要新闻内容。我在互联网上搜索并发现了一个名为Boilerpipe的api,可以免费使用http://boilerpipe-web.appspot.com/但是我无法在java中找到任何可以使用的实现Boilerpipe.Can有人告诉我如何在Java中使用Boilerpipe来提取新闻内容或者给我一些java实现的链接,这些链接利用Boilerpipe从新闻网页中提取内容?
答案 0 :(得分:1)
URL url = new URL("http://www.nydailynews.com/sports/baseball");
ArticleExtractor ae = new ArticleExtractor();
String content = ae.getText(url); // this contains the final text
答案 1 :(得分:0)