tesseract输出文本,但只是废话

时间:2013-03-11 14:33:44

标签: ocr tesseract

我在mac上使用tesseract,并使用瑞典语训练数据http://code.google.com/p/tesseract-ocr/downloads/detail?name=swe.traineddata.gz

我从命令行运行以下命令: sudo tesseract -l swe my.png my.txt

The content of my.png

这就是它在my.txt中输出的内容:

uavum-rn om: mgm.
:mm om names N............
m fw.
<>..,...,.....1,». mm. ^V.m..»...1 W u
|............................ mmm
m«.......
n....... ~.«......«y.= mm
Am...
M-Q-..y...@»~.U.M........»...........   
.;.§............. MYM... WU..
M. www
.<W..L.....w.m.,w»
mm... Hm... ^......... a.....ß..... M
M..
Hm... 3....
>«........
N
1
G
n.......
mmm
mmm »
mmm
MW:-u >«..«.......
M.».....«@>-ms... .a »mm »1
mm... nu .<....-...WMA _..
m........m mm
WW» m
mm w
.-...............u. 
|-...M-11.”.
|........m :>...1.1-1»-.N
Kwwm
M...-«
|.~.»...:-u1.«..... ,-...........
mm M
.-M».....m ...A m...m..<....ß.-.W
.mwwm .M M»-..U..........k
.....-W... .W-;-1

我想念一些参数,我错了吗?

感谢。

1 个答案:

答案 0 :(得分:0)

自从我玩这款引擎以来已经有一段时间但是你的音符响了我,所以我检查了网站。我认为您需要使用此文件Swedish language data for Tesseract 3.02,因为我怀疑您正在使用之前版本中的培训数据。

如果我找到问题的根源,请标记我的答案吗? ;)