Tensorflow分类标签,具有1000个类编码

时间:2017-12-20 09:11:43

标签: tensorflow multiclass-classification

我在Tensorflow中遇到了多类分类问题。标签是字符串类型&拥有1000个唯一值。如何编码?

如果我直接将其作为标签传递,则会出现此错误

ValueError: Labels dtype should be integer Instead got <dtype: 'string'>.

1 个答案:

答案 0 :(得分:2)

您尚未提供任何代码,因此我不知道您实际传递标签的位置。但我可以给出一般答案。

在具有已知数量的类的分类问题中,您只需为每个类分配一个整数。所以在你的情况下,你可以创建一个python字典,将你的单词映射到这样的整数:

word_to_index = {'word1': 0, 'word2': 1, 'word3': 2}
label = 'word2'
index = word_to_index[label]

从你提出问题的方式和你得到的错误(它显示integer),在我看来,你正在使用的API只是期望这样的整数。