Tesseract ChoiceIterator用于混合语言的单词中的符号

时间:2016-08-19 01:47:11

标签: c# ocr wrapper tesseract multilingual

语言是“eng + rus”和load_system_dawg - “F”,load_freq_dawg - “F”。

我认识的字符串:АFGБЦШE。 结果:AFGBLLLLIE。 我正在尝试找到一个设置,其中选择迭代器包含以下变体:

A [eng], A [rus]
F [eng], ...
G [eng], ...
Б [rus], ...
Ц [rus], ...
Ш [rus], ...
E [eng], E [rus]

现在,ChoiceIterator仅包含一种语言的变体(在单词中自动定义)

我想完全禁用单词分析,并接收所有定义语言(eng + rus)中每个字符变体的信息。

有可能吗?

0 个答案:

没有答案