我正在尝试使用Hunspell(v1.7.0)为北印度语单词生成建议。但是Hunspell将某些特殊字符误解为空格,这会导致单词拆分错误。
我已将LC_ALL
和LANG
环境变量设置为hi_IN.UTF-8
(如本SO post所建议)。
我正在使用以下印地语词典:
尽管我不认为这是由于字典的缘故,但上述SO帖子也在讨论相同的问题,尽管没有适当的解决方法。
这是错误的输出:
Hunspell 1.7.0
शब्द <--- The only correct interpreted word
# शब्द 0
द्वारा
# द्व 0
# र 4
ढूंढेगा
# ढूंढेग 0
आवश्यकता
# आवश्यकत 0
कोशिश
# क 0
# श 2
# श 4
बिंदु
# ब 0
# ंदु 2
दुनिया
# ब 0
# ंदुन 2
# य 7
बनाना
# बन 0
# न 3
अपरिमाप्य
# अपर 0
# म 4
# प्य 6