我正在构建一个数据库+工具,用于搜索特定术语的新闻源。例如“坚果食物中毒”。我想搜索社交媒体网站,新闻网站,主要新闻聚合器等......这个词。
答案 0 :(得分:4)
你知道Yahoo! Pipes吗?它是一个非常灵活的feed聚合器,你可以使用YQL来操作它,它非常强大和有一个Python librabry,python-yql :)。 YQL还有针对Twitter以及其他服务和新闻来源的特定“表格”,因此,根据您的需要,您可能甚至不需要Pipes。
http://blog.ouseful.info/2009/04/27/using-yql-with-yahoo-pipes/有一个关于管道+ YQL使用的快速示例,但您可以在YQL Console处使用它们。
那就是你的“问题1”。但是,使用YQL,“问题2”(如果我理解正确的话)很自然,因为你使用它几乎像常规SQL,强加限制,订购等。
答案 1 :(得分:1)
你试过Universtal Feed Parser ??
答案 2 :(得分:0)
谷歌有一个新闻提要api,但我认为这只是非商业用途 http://www.google.com/support/news/bin/answer.py?answer=59255&hl=en
答案 3 :(得分:0)
如果您有支持项目的货币支持,路透社会提供您可以按月订阅的新闻数据。