正在获取TypeError:'(slice(None,None,None),0)'是无效的密钥

时间:2019-03-22 01:39:11

标签: python machine-learning knn

尝试绘制k-NN分类器的决策边界,但无法这样做,导致TypeError:'(slice(None,None,None),0)'是无效键`

    h = .01  # step size in the mesh

    # Create color maps
    cmap_light = ListedColormap(['#FFAAAA', '#AAFFAA', '#AAAAFF','#AFAFAF'])
    cmap_bold  = ListedColormap(['#FF0000', '#00FF00', '#0000FF','#AFAFAF'])

    for weights in ['uniform', 'distance']:
        # we create an instance of Neighbours Classifier and fit the data.
        clf = KNeighborsClassifier(n_neighbors=6, weights=weights)
        clf.fit(X_train, y_train)

        # Plot the decision boundary. For that, we will assign a color to each
        # point in the mesh [x_min, x_max]x[y_min, y_max].
        x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
        y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
        xx, yy = np.meshgrid(np.arange(x_min, x_max, h),
                             np.arange(y_min, y_max, h))
        Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])

        # Put the result into a color plot
        Z = Z.reshape(xx.shape)
        plt.figure()
        plt.pcolormesh(xx, yy, Z, cmap=cmap_light)

        # Plot also the training points
        plt.scatter(X[:, 0], X[:, 1], c=y, cmap=cmap_bold)
        plt.xlim(xx.min(), xx.max())
        plt.ylim(yy.min(), yy.max())
        plt.title("4-Class classification (k = %i, weights = '%s')"
                  % (n_neighbors, weights))

    plt.show()

在运行时不太清楚这是什么意思,不要认为clf.fit有问题,但是我不确定

  TypeError                                 Traceback (most recent call last)
<ipython-input-394-bef9b05b1940> in <module>
     12         # Plot the decision boundary. For that, we will assign a color to each
     13         # point in the mesh [x_min, x_max]x[y_min, y_max].
---> 14         x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
     15         y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
     16         xx, yy = np.meshgrid(np.arange(x_min, x_max, h),

~\Miniconda3\lib\site-packages\pandas\core\frame.py in __getitem__(self, key)
   2925             if self.columns.nlevels > 1:
   2926                 return self._getitem_multilevel(key)
-> 2927             indexer = self.columns.get_loc(key)
   2928             if is_integer(indexer):
   2929                 indexer = [indexer]

~\Miniconda3\lib\site-packages\pandas\core\indexes\base.py in get_loc(self, key, method, tolerance)
   2654                                  'backfill or nearest lookups')
   2655             try:
-> 2656                 return self._engine.get_loc(key)
   2657             except KeyError:
   2658                 return self._engine.get_loc(self._maybe_cast_indexer(key))

pandas\_libs\index.pyx in pandas._libs.index.IndexEngine.get_loc()

pandas\_libs\index.pyx in pandas._libs.index.IndexEngine.get_loc()

TypeError: '(slice(None, None, None), 0)' is an invalid key

11 个答案:

答案 0 :(得分:8)

由于您尝试直接以数组形式访问,因此遇到了此问题

尝试一下::

from sklearn.impute import SimpleImputer
imputer = SimpleImputer(missing_values = np.nan, strategy = 'mean',verbose=0)
imputer = imputer.fit(X.iloc[:, 1:3])
X.iloc[:, 1:3] = imputer.transform(X.iloc[:, 1:3])

使用 iloc / loc 将解决此问题。

答案 1 :(得分:2)

我在使用时遇到了同样的问题

features = data.iloc[:,:-1]
si = SimpleImputer(missing_values = np.nan, strategy = 'mean')
si.fit(features[:, 1:])

然后我通过调用 .values() 函数/方法到 iloc 的输出来解决这个问题,然后作为 numpy.ndarray 它工作了!

features = data.iloc[:,:-1].values()
si = SimpleImputer(missing_values = np.nan, strategy = 'mean')
si.fit(features[:, 1:])

答案 2 :(得分:1)

尝试在上面编写代码之前运行此代码。

convolve

答案 3 :(得分:0)

您需要使用iloc / loc来访问df,请尝试将iloc添加到X,以便X.iloc [:,0]

答案 4 :(得分:0)

您必须创建数组

x_min,x_max = X [:, 0] .min()-1,X [:, 0] .max()+ 1 y_min,y_max = X [:, 1] .min()-1,X [:, 1] .max()+ 1

这出现在数据框中

您必须首先通过此将数据帧转换为数组 然后使用dataframe.values

答案 5 :(得分:0)

我通过将pandas数据帧转换为numpy数组来修复它。从here

获得了帮助

答案 6 :(得分:0)

from sklearn.impute import SimpleImputer

imputer = SimpleImputer(missing_values= np.nan, strategy= 'mean')

imputer = imputer.fit(X.iloc[:, 1:3])
X = imputer.transform(X.iloc[:, 1:3])

答案 7 :(得分:0)

我在以下方面遇到了相同的问题

X = dataset.iloc[:,:-1]

然后我添加了.values属性,之后该属性可以正常工作

X = dataset.iloc[:,:-1].values

答案 8 :(得分:0)

我改为将输入更改为numpy数组,并且它起作用了。我仍然无法使用Pandas数据框输入来解决此问题。如果您的情况很紧急,建议您将输入内容更改为numpy并继续操作。

答案 9 :(得分:0)

当您尝试使用熊猫获取数据集时,请使用以下代码:

dataset = pd.read_csv("path or file name")
x = dataset.iloc[:,:-1].values
y = dataset.iloc[:,-1].values

答案 10 :(得分:0)

您使用哪个库加载数据集?
如果使用Pandas库加载数据集,则需要在数据框中添加基于索引的选择(iloc)函数,以访问值,例如

import pandas as pd
data=pd.read_csv('../filename.csv')
X=data.iloc[:,0:8]
y=data.iloc[:,8] 

针对您的问题:

x_min, x_max = X.iloc[:, 0].min() - 1, X.iloc[:, 0].max() + 1

如果您使用NumPy库加载数据集,则可以直接以数组形式访问值,例如

from numpy import loadtxt
data=loadtxt('../filename.csv',delimiter=',')
X=data[:,0:8]
y=data[:,8]

针对您的问题:

x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1