标签: c# pdf itext ocr hebrew
HebrewBooks.com上有一个用OCR扫描的大型希伯来语书籍。我想编写一个实用程序,它允许我浏览PDF文件中的每个字符,并在OCR提取的字符的同时查看字符图像,以便在出错时我可以更正它。
我目前正在使用iText。如何显示角色的图像并将文本写在下面进行编辑?
为了澄清,我不是试图将iText用于OCR。 我将是我用精心调整的阅读技巧进行OCR的人。我想要的是让我更容易检查字母的图像与OCR选择的字符。我想同时显示嵌入在PDF中的字符和从中提取字符的页面图像。