Question

我只想根据自己的数据集通过attention_ocr训练OCR模型，但我不知道如何以与FSNS数据集相同的格式存储我的图像和基础事实。

根据README.md： ＆＃34;如何使用自己的图像数据来训练模型＆＃34; 它提供了两种选择，但我真的不明白这意味着什么。

option1：以与FSNS数据集相同的格式存储数据，只需重用python / datasets / fsns.py模块。例如，创建一个文件数据集/ newtextdataset.py：有一些代码......

import fsns

DEFAULT_DATASET_DIR = 'path/to/the/dataset'

DEFAULT_CONFIG = {
    'name':
        'MYDATASET',
    'splits': {
        'train': {
            'size': 123,
            'pattern': 'tfexample_train*'
        },
        'test': {
            'size': 123,
            'pattern': 'tfexample_test*'
        }
    },
    'charset_filename':
        'charset_size.txt',
    'image_shape': (150, 600, 3),
    'num_of_views':
        4,
    'max_sequence_length':
        37,
    'null_code':
        42,
    'items_to_descriptions': {
        'image':
            'A [150 x 600 x 3] color image.',
        'label':
            'Characters codes.',
        'text':
            'A unicode string.',
        'length':
            'A length of the encoded text.',
        'num_of_views':
            'A number of different views stored within the image.'
    }
}


def get_split(split_name, dataset_dir=None, config=None):
  if not dataset_dir:
    dataset_dir = DEFAULT_DATASET_DIR
  if not config:
    config = DEFAULT_CONFIG

  return fsns.get_split(split_name, dataset_dir, config)

这是否意味着我需要编写自定义代码将我的数据集作为FSNS格式存储在文件中？

如果是这样，我应该采用什么格式？我应该以什么格式存储一堆数据集？

如何以与FSNS数据集相同的格式创建数据集以及格式如何？

0 个答案: