我目前正在寻找使用TensorFlow而不是使用numpy进行数据准备。 我认为可以在输入管道中的解析函数中添加一些元素。
当我浏览文档时,我遇到了功能专栏。 如果使用原始数据并将数据传递给估计器,功能列似乎可以帮助我们进行数据清理。
我想知道是否有类似于功能列的功能可以对原始数据进行存储。
我所说的存储桶到底是什么意思,假设我有像这样的数据集
[['num'] #the column headers is for representation only
[10],
[20],
[30],
[40],
[50],
[60],
[70],
[80],
[90],
[100]]
我想在上一行中创建一个热点,但要在存储桶中创建一个热点, 输出看起来像
[['10-50', '51-100'] #the column headers is for representation only
[ 1 , 0 ]
[ 1 , 0 ]
[ 1 , 0 ]
[ 1 , 0 ]
[ 1 , 0 ]
[ 0 , 1 ]
[ 0 , 1 ]
[ 0 , 1 ]
[ 0 , 1 ]
[ 0 , 1 ]]
有没有可以自动为我执行此功能的功能? 我知道我可以使用tf.cond函数来实现此功能,但是实现起来可能很麻烦且很耗时。 我想知道是否有任何即插即用功能
相关链接: How feature columns work in tensorflow? https://www.tensorflow.org/guide/feature_columns