我想从专业文档集中提取术语单位。是否有任何算法或开箱即用的解决方案? nltk可以这样做吗?
似乎这个帖子解决了我的问题。 Extracting terms with contextual relevance (noun phrases) from text in a .NET project
答案 0 :(得分:1)
您想要的描述不是很清楚。为了获得更好的帮助,您可能还应该发布一个示例
听起来你正在寻找的是Named Entity Recognition。完全取决于您想要的(和您的数据),现有的系统非常好,但问题肯定没有解决。如果这是您想要的,要查看的重要系统是GATE,Apache OpenNLP甚至是NLTK。