在纯Tensorflow中混合分类和连续数据

时间:2017-01-26 11:03:22

标签: python tensorflow neural-network deep-learning conv-neural-network

如何从CSV文件(例如Titanic dataset)中获取分类和连续数据,并在不使用tf.learn API(即纯Tensorflow)的情况下将其变为Tensorflow的良好格式?

例如,

  • 分类数据可能是(在我的情况下)'vehicle_make','vehicle_model'
  • 连续数据可能是'价格','里程'

然后,我想将此数据用作多层感知器神经网络的输入,如下例所示:

https://github.com/aymericdamien/TensorFlow-Examples/blob/master/notebooks/3_NeuralNetworks/multilayer_perceptron.ipynb

干杯,

巴兹

1 个答案:

答案 0 :(得分:3)

您可以对分类数据使用单热编码。

基本上你可以将vehicle_model映射到数值

特斯拉S - > 1

福特福克斯 - > 2

... - >我

然后使用全零的向量和第i个位置的1来表示该值:

特斯拉S - > [1,0,0]

福特福克斯 - > [0,1,0]

tensorflowscikit learn都有执行此操作的功能。

按原样包含连续数据,作为输入向量的值之一。