如何阅读有草书写作的Tiff文件或jpg文件?

时间:2011-02-28 18:23:08

标签: java ocr

我开发了一个软件,可以将tiff转换为jpg,然后读取jpg文件,但只有在jpg上进行简单的书写时,此软件才有效文件(意思是简单的英文字体),但我想阅读草书字体,所以任何人都可以帮助我摆脱这种局面。我已经尝试了很多,但我找不到任何暗示,所以请帮助..我不明白我用的是哪个库?所以帮助我阅读有草书写作的图像。

感谢你 vipul chauhan

1 个答案:

答案 0 :(得分:1)

听起来你想在草书字体文档上做OCR。如果你的意思是手写,我会立即放弃(一般来说这是一个非常困难的问题)。如果它是您拥有的特定字体(或者至少您可以创建该字体的每个字母的图片数据库),那么您可以尝试使用可以使用新字体训练的现有OCR库。

例如:Tesseract-OCROCRopus。也可以尝试谷歌搜索“java ocr train”左右。