在聚类过程之后,我有一堆有相似之处的单词。我想对这些词进行分类。
例如,如果我有这样的话:
也许正确的类别是语义网。
我知道这种问题可以通过NLP解决,但我是NLP的新手,我不知道从哪里开始。任何人都可以说我的正确方法是什么?或者如果可以到达?
注意:我发现类似的问题他们已经通过搭配和POS标记解决了。我可以将它应用于这个特定的问题吗?
答案 0 :(得分:1)
您可以搜索有关主题标签的论文 - 这通常被认为是一个非常难的问题。如下的论文可能是一个很好的起点。作者还有一些其他相关的内容。
Lau,J。H.,Grieser,K。,Newman,D。,& Baldwin,T。(2011年6月)。自动标记主题模型。在计算语言学协会第49届年会论文集:人类语言技术 - 第1卷(第1536-1545页)。计算语言学协会。