Tesseract土耳其语的OCR立方体文件

时间:2015-08-31 07:30:02

标签: ocr tesseract

我在哪里可以找到cube模式的tesseract ocr土耳其语扩展名?

文件:

class MyModel(models.Model):
    parent_content_type = models.ForeignKey(ContentType, related_name='prereq_parent')
    parent_object_id = models.PositiveIntegerField()
    parent_object = GenericForeignKey("parent_content_type", "parent_object_id")

    ...

    def get_parent(self):
       try:
           return self.parent_content_type.get_object_for_this_type(pk=self.parent_object_id)
       except ObjectDoesNotExist:
           #do something that will result in this instance of MyModel to be deleted

2 个答案:

答案 0 :(得分:4)

它包含所有文件,只需此文件足够“tur.traineddata”

https://github.com/tesseract-ocr/tessdata/blob/master/tur.traineddata

https://github.com/tesseract-ocr/langdata/tree/master/tur

-

如果您确实需要表现并且愿意失去一些准确性,您也可以使用tessdata_fast中经过培训的数据。

https://github.com/tesseract-ocr/tessdata_fast/blob/master/tur.traineddata

处抓取土耳其语版本

答案 1 :(得分:1)

无处。 Cube是死胡同,将从tesseract中删除,例如见https://github.com/tesseract-ocr/tesseract/issues/40