我正在尝试使用Tensorflow创建二进制分类程序。通过调用tf.decode_csv从csv文件中读取功能和标签。
示例代码现在可以正常工作,csv中有四列(前三个是功能,最后一个是标签)。我们将空(缺失)列的默认值设置为1。
record_defaults = [[1],[1], [1],[1]]
columns = tf.decode_csv(record_string, record_defaults=record_defaults)
考虑到训练数据实际上是稀疏矩阵,我们不希望用平均值或其他值替换空字段,我们希望使用支持缺失值的算法。
所以,我有两个问题:
1:如何为tf.decode_csv函数指定“空”张量而不是标量数据?
2:在我的示例代码中,我使用下面的代码逻辑来训练模型,matmul是否支持空张量?也许空张量将被视为0?
W = tf.Variable(tf.zeros([2, 2]), name="W")
b = tf.Variable(tf.zeros([2]))
x = tf.cast(x, tf.float32)
y = tf.matmul(x, W) + b