我正在浏览这个plagiarism detector并试图在Haskell中编写一个程序,它将读取一个文件并用同义词替换它的一些单词。在Haskell中有没有可用于此目的的字典?
此外,如果您有关于算法的任何输入或与此问题相关的任何其他输入,例如如何通过用同义词替换单词来避免更改语句的上下文,那么请发布它。
答案 0 :(得分:3)
Haskell有没有可用于此目的的词典?
我认为你要找的是纯文本文件,如下所示:
word1: word1synonym1, word1synonym2, ...
word2: word2synonym1, ...
...
在这种情况下,它实际上不是特定于Haskell的。我不知道任何像这样的免费文本文件字库,但我想如果你在LibreOffice挖掘,你可能会找到一个。
如何通过用同义词替换单词来避免更改语句的上下文
这对于计算机来说非常困难,afaik。我建议不要在这方面付出太多努力。
有关算法的任何输入
您可能会发现edit distance的概念对此问题很有用。请参阅Approximate string matching和Wagner-Fischer algorithm。