如何从CSV文件(例如Titanic dataset)中获取分类和连续数据,并在不使用tf.learn API(即纯Tensorflow)的情况下将其变为Tensorflow的良好格式?
例如,
然后,我想将此数据用作多层感知器神经网络的输入,如下例所示:
干杯,
巴兹
答案 0 :(得分:3)
您可以对分类数据使用单热编码。
基本上你可以将vehicle_model映射到数值
特斯拉S - > 1
福特福克斯 - > 2
... - >我
然后使用全零的向量和第i个位置的1来表示该值:
特斯拉S - > [1,0,0]
福特福克斯 - > [0,1,0]
tensorflow和scikit learn都有执行此操作的功能。
按原样包含连续数据,作为输入向量的值之一。