解决同音混淆

时间:2014-04-03 07:07:25

标签: nlp nltk text-processing stanford-nlp

这可能是一个不适合stackoverflow的问题,但我没有其他更好的地方可以问它。我想知道是否有任何已知的工具(非商业用途)可以用来解决这些句子中的同音词混淆?

  • 它与
  • 相比
  • 你和你的

我是NLP的新手,我还没有使用任何已知的工具。试图在谷歌搜索这些,但没有任何有用的显示。 NLTK或CoreNLP中是否有任何部分涵盖此内容?

2 个答案:

答案 0 :(得分:2)

我没有这个主题的经验,但我找到了一些可能对您有用的PDF文件。

How to solve homophone problems

答案 1 :(得分:1)

它没有完整的解决方案,但LanguageTool对此有一些规则。请参阅rule file并搜索rulegroup id="IT_IS"(免责声明:我是LanguageTool的维护者)。 After the Deadline也使用基于规则的方法,只是它试图通过过滤其对大型n-gram数据库的建议来避免无用的建议。