我只想根据自己的数据集通过attention_ocr训练OCR模型,但我不知道如何以与FSNS数据集相同的格式存储我的图像和基础事实。
根据README.md: "如何使用自己的图像数据来训练模型" 它提供了两种选择,但我真的不明白这意味着什么。
option1:以与FSNS数据集相同的格式存储数据,只需重用python / datasets / fsns.py模块。例如,创建一个文件数据集/ newtextdataset.py:有一些代码......
import fsns
DEFAULT_DATASET_DIR = 'path/to/the/dataset'
DEFAULT_CONFIG = {
'name':
'MYDATASET',
'splits': {
'train': {
'size': 123,
'pattern': 'tfexample_train*'
},
'test': {
'size': 123,
'pattern': 'tfexample_test*'
}
},
'charset_filename':
'charset_size.txt',
'image_shape': (150, 600, 3),
'num_of_views':
4,
'max_sequence_length':
37,
'null_code':
42,
'items_to_descriptions': {
'image':
'A [150 x 600 x 3] color image.',
'label':
'Characters codes.',
'text':
'A unicode string.',
'length':
'A length of the encoded text.',
'num_of_views':
'A number of different views stored within the image.'
}
}
def get_split(split_name, dataset_dir=None, config=None):
if not dataset_dir:
dataset_dir = DEFAULT_DATASET_DIR
if not config:
config = DEFAULT_CONFIG
return fsns.get_split(split_name, dataset_dir, config)
这是否意味着我需要编写自定义代码将我的数据集作为FSNS格式存储在文件中?
如果是这样,我应该采用什么格式?我应该以什么格式存储一堆数据集?