我在python中编写RSS阅读器作为学习练习,我真的希望能够使用关键词标记单个条目以进行搜索。遗憾的是,大多数真实世界的Feed都不包含关键字元数据。我目前在我的测试数据库中有大约60,000个条目来自大约600个提要,因此手动标记不会有效。到目前为止,我只能找到两种解决方案:
1:使用Natural Language Toolkit提取关键字:
2:使用Google Adwords API从文章网址中获取关键字建议:
任何人都可以提供任何建议吗?我担心让我的adwords帐号被禁止是没有根据的吗?
答案 0 :(得分:2)
根据您的具体需求,您可以考虑使用许多免费和商业文本注释工具/服务,列于:
Is there a better tool than OpenCalais?。
其中一些提供实体,一些提供关键字相关性的衡量标准,另一些提供主题标签。
答案 1 :(得分:1)
您可以使用 delicious suggested tags API 。
如何通过python http://www.michael-noll.com/projects/delicious-python-api/
使用api的示例另一种选择是 Open Calais