是否存在任何带有给定文本(标题)的Java库,其中包含重要单词的集合。
编辑:重要的是我指的是定义句子主要思想的那个。
谢谢。
答案 0 :(得分:4)
您可能需要查看Apache Mahout。
您还可以在tf-idf model上阅读更多内容,这些内容通常用于与您描述的案例类似的案例。
编辑:有关Tf-Idf模型的更多信息:
tf-idf模型基本上说了两件事:
tf-idf模型利用这一假设,并根据tf,idf值给出每个术语的评级。
要查找idf值,您可能希望为您的集合编制索引或使用某些搜索引擎API并根据结果数量估算每个术语的常见程度[请注意,引擎返回的数字并不准确,但是它可能被用作粗略估计]
答案 1 :(得分:2)
Topic models尝试对文档(或文档集合)执行此操作。我怀疑你可以用单个句子做很多事。
您可以尝试使用语义解析器(例如RelEx)来尝试获取主要主题/对象/等,但它仍然不是那么简单。
您尝试做的一些示例会有所帮助。 “定义主要观点”仍然很模糊 - 你在处理什么类型的句子?
答案 2 :(得分:2)