如何使用hunspell(或其他软件包)使用我自己的“字典”来纠正单词?

时间:2019-12-11 19:44:14

标签: r hunspell

我想根据名称正确的另一个列表来更正一些拼写错误的名称。

例如,我有这段文字:

ff Kazaroy, Sengir Pureblood S aE Didcono Ungido Ae yf Soldado do Bispo Ue ra Lamina Celeste daLegiao L

我有这个列表:

Kazarov,Sengir Pureblood / DiáconoUngido / Soldado do Bispo / LâminaCeleste daLegião

我不希望hunspell根据英语词典或任何词典在我的文本上更正这些单词(因为Kazarov是俄语名称,有些单词是英语,有些单词是葡萄牙语),所以我宁愿使用我的清单是“字典”。我尝试使用add_words函数添加自定义单词。

我尝试过,例如

text2 <- hunspell(text, dict = dictionary(add_words = "Kazarov, Sengir Pureblood")
print(text2[[1]])
hunspell_suggest(text2[[1]])

但是,不仅它不起作用,而且仍然使用英语词典。我正在考虑以某种方式创建自定义词典,但是我觉得它效率不高(而且我什至不知道该怎么做)。

有什么建议吗?

1 个答案:

答案 0 :(得分:0)

我认为问题在于:

dictionary(add_words = "Kazarov, Sengir Pureblood")

add_words应该是字符向量。

尝试:

dictionary(add_words = c("Kazarov", "Sengir", "Pureblood"))

看起来Kazarov / Kazaroy仍然有问题,但其他两个单词都可以正常使用。