在Haskell中用同义词替换单词

时间:2011-10-03 14:36:42

标签: haskell dictionary plagiarism-detection

我正在浏览这个plagiarism detector并试图在Haskell中编写一个程序,它将读取一个文件并用同义词替换它的一些单词。在Haskell中有没有可用于此目的的字典?

此外,如果您有关于算法的任何输入或与此问题相关的任何其他输入,例如如何通过用同义词替换单词来避免更改语句的上下文,那么请发布它。

1 个答案:

答案 0 :(得分:3)

  

Haskell有没有可用于此目的的词典?

我认为你要找的是纯文本文件,如下所示:

word1: word1synonym1, word1synonym2, ...
word2: word2synonym1, ...
...

在这种情况下,它实际上不是特定于Haskell的。我不知道任何像这样的免费文本文件字库,但我想如果你在LibreOffice挖掘,你可能会找到一个。

  

如何通过用同义词替换单词来避免更改语句的上下文

这对于计算机来说非常困难,afaik。我建议不要在这方面付出太多努力。

  

有关算法的任何输入

您可能会发现edit distance的概念对此问题很有用。请参阅Approximate string matchingWagner-Fischer algorithm