我对Tensor Flow比较新。这个功能列是什么?它如何影响培训?
当我实现如下代码时,此数字列将创建为要素列。我想了解其用途。
feature_columns = [tf.feature_column.numeric_column("x", shape=[1])]
estimator = tf.estimator.LinearRegressor(feature_columns=feature_columns)
x_train = np.array([1., 2., 3., 4.])
y_train = np.array([0., -1., -2., -3.])
x_eval = np.array([2., 5., 8., 1.])
y_eval = np.array([-1.01, -4.1, -7, 0.])
input_fn = tf.estimator.inputs.numpy_input_fn(
{"x": x_train}, y_train, batch_size=4, num_epochs=None, shuffle=True)
train_input_fn = tf.estimator.inputs.numpy_input_fn(
{"x": x_train}, y_train, batch_size=4, num_epochs=1000, shuffle=False)
eval_input_fn = tf.estimator.inputs.numpy_input_fn(
{"x": x_eval}, y_eval, batch_size=4, num_epochs=1000, shuffle=False)
estimator.train(input_fn=input_fn, steps=10000)
train_metrics = estimator.evaluate(input_fn=train_input_fn)
eval_metrics = estimator.evaluate(input_fn=eval_input_fn)
print("\n\ntrain metrics: %r"% train_metrics)
print("eval metrics: %r"% eval_metrics)
答案 0 :(得分:5)
基于我可以从documentation on feature columns收集的信息,它们似乎用于将某种输入数据特征转换为可由回归或神经网络模型使用的连续变量。
例如,在回归中,如果我们有一个分类变量,通常首先将其转换为一组dummy variables。 tf.feature_column.indicator_column可用于为我们进行此转换。然后我们可以在feed dict中输入分类数据,并且内部会转换为虚拟变量。
如果是numeric_column
,则不需要进行此类转换,因此该类基本上就像tf.placeholder
一样。