ValueError:功能不在功能字典中

时间:2017-12-04 14:26:00

标签: python numpy dictionary tensorflow

我正在尝试使用TensorFlow编写一个简单的深度机器学习模型。 我正在使用我在Excel中制作的玩具数据集,只是为了让模型正常工作并接受数据。我的代码如下:

import pandas as pd
import numpy as np
import tensorflow as tf

raw_data = np.genfromtxt('ai/mock-data.csv', delimiter=',', dtype=str)
my_data = np.delete(raw_data, (0), axis=0) #deletes the first row, axis=0 indicates row, axis=1 indicates column
my_data = np.delete(my_data, (0), axis=1) #deletes the first column

policy_state = tf.feature_column.categorical_column_with_vocabulary_list('policy_state', [
    'AL', 'CA', 'MI'
])

modern_classic_ind = tf.feature_column.categorical_column_with_vocabulary_list('modern_classic_ind', [
    '0', '1'
])

h_plus_ind = tf.feature_column.categorical_column_with_vocabulary_list('h_plus_ind', [
    '0', '1'
])

retention_ind = tf.feature_column.categorical_column_with_vocabulary_list('retention_ind', [
    '0', '1'
])

feature_columns = [
    tf.feature_column.indicator_column(policy_state),
    tf.feature_column.indicator_column(modern_classic_ind),
    tf.feature_column.indicator_column(h_plus_ind)
]
classifier = tf.estimator.DNNClassifier(feature_columns=feature_columns,
                                      hidden_units=[10, 20, 10],
                                      n_classes=3,
                                      model_dir="/tmp/ret_model")

train_input_fn = tf.estimator.inputs.numpy_input_fn(
x={"x": np.array(my_data[:, 0:3], dtype=str)},
y=np.array(np.array(my_data[:, 3], dtype=str)),
num_epochs=None,
shuffle=True)

classifier.train(input_fn=train_input_fn, steps=2000)

不幸的是,我收到以下错误。我已经尝试修剪csv文件中的标签,而不是留下它们,命名功能列不同的东西,以及更改numpy数组的类型。错误仍然存​​在。

ValueError: Feature h_plus_ind is not in features dictionary.

如果我删除h_plus_ind,它只会将错误抛出到其他列上。

4 个答案:

答案 0 :(得分:10)

使用tf.feature_columns时,您在input_fn中输入的数据应与先前创建的功能列具有相同的键。 因此,x的{​​{1}}应该是字典,其中的键以train_input_fn命名。

一个模拟的例子:

feature_columns

侧面:

来自开发者Google博客的精彩article可能是一个很好的阅读,因为它引入了一种直接从带有x = {"policy_state": np.array(['AL','AL','AL','AL','AL']), "modern_classic_ind": np.array(['0','0','0','0','0']), "h_plus_ind": np.array(['0','0','0','0','0']),} API的csv文件创建input_fn的新方法。它具有更好的内存管理,并避免将所有数据集加载到内存中。

答案 1 :(得分:0)

我有同样的问题,但是当我检查数据库列的名称时,列名称有一个小错误。检查您列的名称。

答案 2 :(得分:0)

我遇到了同样的问题。在我的情况下,目标变量也被输入到功能字典中,我从功能字典中删除了它并起作用了。

答案 3 :(得分:0)

如果由于TF服务而到达此页面,则另一种可能性是字典中以serving_input_fn传递的键与模型中的键不对应,只需仔细检查字典即可。