开源等效于opencalais(最好是PHP还是Python?)

时间:2011-08-04 10:32:09

标签: php python text-processing

是否有一个等效于opencalais的开源 - 最好是在PHP或Python中?

3 个答案:

答案 0 :(得分:0)

从概念上讲,这是一个有趣的想法。它似乎是解析基本文本或HTML内容,然后将实体包装在microformats

为什么不为他们的服务提供Web API?

自己实现解决方案应该是直截了当的 - 这只是大量正则表达式和微格式模板的情况。

答案 1 :(得分:0)

似乎他们的主要服务是Named Entity Recognition,并在此基础上进行了一些推断。 NER仍然是自然语言处理中的一个研究问题。这意味着没有一种适合所有人的算法,尽管商业提供商可能会试图说服你。

那就是说,Python的nltk does have some relevant features

答案 2 :(得分:0)

命名实体识别的

Stanford NERDependency parser将成为与Opencalais等效的一些构建块。