标签: ocr tesseract python-tesseract text-extraction
我正在尝试使用自定义图像训练 tesseract。我创建了一个小的图像数据集并创建了框文件。是否有任何可用的开源样本训练数据集可用于测试训练设置?
我在各种平台上搜索过,大多数都只提供字体文件。 我正在寻找类似一组图像和与之对应的框文件之类的东西。
提前致谢! :)