在python中是否有一种方法(通过使用NLTK或SpaCy或任何其他库),我可以预测该单词的POS标记,该标记可能会跟随我到目前为止输入的单词。
例如,如果我输入
我要去
显示下一个最可能出现的单词的POS标签
例如NN,因为大学可以在此之后参加
答案 0 :(得分:2)
您可以使用LSTM在POS标签数据上训练简单的语言模型。也就是说,使用Spacy,将您的语料库转换为POS标签语料库。使用新的语料库训练模型。预测评估的POS。另一种方法是通过在数据上建立语言模型,生成下一个单词并找到其POS。
答案 1 :(得分:0)
我建议您熟悉CoNNL-U格式。 http://universaldependencies.org/format.html
也可能是UDPipe https://lindat.mff.cuni.cz/services/udpipe/