在tensorflow中提供标签的最佳方式

时间:2017-10-28 08:44:18

标签: python tensorflow labels training-data

我有一个由图像组成的训练集,我必须预测一个由固定数量的字母和数字组成的标签。 将这些标签送入张量流的最佳方法是什么?我想创建一个数字列表,一个用于标签中的所有字符/数字。 我创建了一个列表,其中包含可能的值:

__dict = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u',
          'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9']

然后我使用__dict变量中的字母索引将标签编码为数字列表。 例如:

label = abc
label_encoded = [0, 1, 2]

这是正确的方法吗?

1 个答案:

答案 0 :(得分:1)

最好的方法是为每个标签使用一个唯一的整数,即aaa = 0,aab = 1等

您可以方便地使用基数为36的位置编码(如果字母是小写的英文字符+数字)。

我不知道您遇到的问题,但请注意这可能导致大量标签(即您的分类问题的输出类)这一事实