如何获得非正式的同义词(即技术=>技术)?

时间:2013-11-09 04:24:55

标签: ruby nlp

如何获得单词的非正式同义词或缩写?我尝试使用词干分析器(如Porter过滤器)和词典,但它们似乎不能识别单词的“非正式”同义词。我想我下面的例子不是真正的同义词,而是缩写。

示例包括:

  1. 技术=>技术
  2. 商家=>商务
  3. Applications =>应用

1 个答案:

答案 0 :(得分:0)

据我所知,没有这样的图书馆。您在问题中提到的同义词/缩写是任何自然语言的进化性质的一部分。也就是说,硬编码这样的列表永远不会给你一个完整的等价列表。

唯一好的长(或甚至中等)术语解决方案是使用适当的NLP / ML范例来“学习”它们。这种等价性高度依赖于上下文。例如:

  • NLP == 自然语言处理神经语言程序设计(含糊不清的首字母缩写词)
  • 英尺。 == foot 特色(含糊不清的缩写)

解释了这种背景依赖的历史(并且略带哲学)的表达here。有关更多日常示例,请参阅this Wikipedia disambiguation page(这是上面列表中的第二个示例)。

基本上,我在这里要说明的是,没有现成的工具/库,因为解决同义词(特别是口语术语,缩写等)是一个难题。