标签: algorithm artificial-intelligence nlp
我想根据文本的分类(类别/偏差等)对文本中的单词进行着色。我有一个完全工作的字典,但问题是有很多歧义。例如,foedere可以是动词“fornicate”或名词“条约”的形式。
foedere
解决这些含糊不清或产生良好猜测的一般策略是什么?
谢谢!
答案 0 :(得分:3)
一般策略是首先对数据运行part-of-speech tagger以确定单词类别(名词,动词等)。但是,这需要数据(上下文统计)和工具。 This research paper可能是一个起点。