应用错误收集

单词着色和语法分析

时间：2010-10-17 14:12:43

标签： algorithm artificial-intelligence nlp

我想根据文本的分类（类别/偏差等）对文本中的单词进行着色。我有一个完全工作的字典，但问题是有很多歧义。例如，foedere可以是动词“fornicate”或名词“条约”的形式。

解决这些含糊不清或产生良好猜测的一般策略是什么？

谢谢！

1 个答案:

答案 0 :(得分：3)

一般策略是首先对数据运行part-of-speech tagger以确定单词类别（名词，动词等）。但是，这需要数据（上下文统计）和工具。 This research paper可能是一个起点。