为何Hunspell将某些印地语字符视为空白?

时间:2019-07-15 12:19:03

标签: c shell spell-checking hunspell

我正在尝试使用Hunspell(v1.7.0)为北印度语单词生成建议。但是Hunspell将某些特殊字符误解为空格,这会导致单词拆分错误。

我已将LC_ALLLANG环境变量设置为hi_IN.UTF-8(如本SO post所建议)。

我正在使用以下印地语词典:

尽管我不认为这是由于字典的缘故,但上述SO帖子也在讨论相同的问题,尽管没有适当的解决方法。

这是错误的输出:

Hunspell 1.7.0
शब्द <--- The only correct interpreted word
# शब्द 0

द्वारा
# द्व 0
# र 4

ढूंढेगा
# ढूंढेग 0

आवश्यकता
# आवश्यकत 0

कोशिश
# क 0
# श 2
# श 4

बिंदु
# ब 0
# ंदु 2

दुनिया
# ब 0
# ंदुन 2
# य 7

बनाना
# बन 0
# न 3

अपरिमाप्य
# अपर 0
# म 4
# प्य 6

0 个答案:

没有答案