文章的概念标记

时间:2014-05-14 13:14:03

标签: nlp classification taxonomy text-analysis apache-stanbol

我有一组文章,我想从每篇文章中提取概念。这个概念可以是独立的,也可以联系在一起形成一个新的概念。

为此,最近我遇到了各种付费API,例如,HP DEMAND上的IDOL(http://www.autonomy.com/technology/idol-functions/conceptual-search),数据和谐(http://www.dataharmony.com/services-view/mai-components/),ALCHEMY API(http://www.alchemyapi.com/products/features/concept-tagging/ )等。但我有一套非常庞大的文件,并且无法使用价格合理的API。是否有任何免费工具可以做到这一点?此外,我也了解DBPedia数据集,这些数据集用于将概念链接在一起。但我还没弄明白如何使用它们。任何有关这方面的帮助都会有用。

另外,我早就使用过Stanbol NLP工具。我想知道这是否可以通过它完成,或者是否由其他任何工具完成。

1 个答案:

答案 0 :(得分:1)

我意识到这并没有回答你关于斯坦博尔的问题,但惠普的IDOL OnDemand对公众开放,目前完全免费提供啤酒。正如您已将其确定为潜在的解决方案,现在是时候尝试一下了!

免责声明:我为惠普工作,并参与了IDOL OnDemand。