在页面搜索中使用R进行网页报废

时间:2016-09-25 17:24:25

标签: r web-scraping

我正在尝试使用网站公开数据http://www.autonews.com/section/searchresults?q=new%20launch%20ford

收集项目数据

我必须在新闻标题中删除包含Ford2005launch等特定字词的结果。我想从查询返回的所有页面中删除整个标题以及主体文本(页面1,2,3在底部提到)。

在提供的链接中,我应该得到以下结果,

“福特Fusion推出于2005年10月24日中断”和“车身:福特汽车公司坚持供应......”

是否可以使用R?哪个包最有用?任何有关实施的指导都会非常有帮助。

干杯!

PS:如果我不清楚,请告诉我。

0 个答案:

没有答案