从站点提取数据

时间:2014-02-07 15:33:02

标签: java

我想从网站中提取数据。我已经使用文章提取器从网站获取信息,但现在我想获得有关特定地点事件的信息。当我将位置作为输入时,我想在那个地方获取事件。例如,我想从这个网站提取信息" http://www.indianevents.org/events-Rajasthan-14.htm"我能够提取所有活动,节日等。

URL url;
url = new URL(str);
InputSource is = HTMLFetcher.fetch(url).toInputSource();      
BoilerpipeSAXInput in = new BoilerpipeSAXInput(is);
TextDocument doc = in.getTextDocument();       
news=ArticleExtractor.INSTANCE.getText(doc);

1 个答案:

答案 0 :(得分:2)

尽管写这个听起来很简单(相信我很难)。 祝好运。 :)