TensorFlow:数据集可以包含字符串类别值吗?

时间:2017-12-18 18:00:23

标签: tensorflow

使用TensorFlow,可以很容易地从示例中确定数据包含数值。例如:

x_train = [1, 2, 3, 4]
y_train = [0, -1, -2, -3]

但是,它是否也适用于字符串类别值?例如:

x_train = ["sunny", "rainy", "sunny", "cloudy"]
y_train = ["go outside", "stay inside", "go outside", "go outside"]

如果没有,我必须假设TensorFlow有一种处理分类值的方法。也许通过一些聪明的技巧,例如以某种系统的方式将它们转换为数值。

1 个答案:

答案 0 :(得分:1)

是的,TensorFlow支持具有分类功能的数据集。也许使用它们最简单的方法是使用Feature Column API,它提供tf.feature_column.categorical_column_with_vocabulary_list()(用于处理小的,已知的类别集)和tf.feature_column.categorical_column_with_hash_bucket()等方法(用于处理大型问题)和潜在无限的类别集。)