在numpy文件中存储和提取数组时出现问题

时间:2018-06-28 16:40:27

标签: python-3.x numpy numpy-ndarray

但是,尝试将数组存储在numpy文件中时,尝试将其提取并使用它,并在尝试将数组应用于序列时收到错误消息。

这是两个数组,不确定是哪个数组导致了问题。

X = [[1,2,3],[4,5,6],[7,8,9]]
y = [0,1,2,3,4,5,6....]

尝试检索它并使用它获取值时:

X: array(list[1,2,3],list[4,5,6],list[7,8,9])
y = array([0,1,2,3,4,5...])

代码如下:

vectors = np.array(X)
labels = np.array(y)

检索t-sne上的工作

visualisations = TSNE(n_components=2).fit_transform(X,y)

我收到以下错误:

ValueError                                Traceback (most recent call last)
<ipython-input-11-244f99341167> in <module>()
----> 1 visualisations = TSNE(n_components=2).fit_transform(X,y)

C:\ProgramData\Anaconda3\lib\site-packages\sklearn\manifold\t_sne.py in fit_transform(self, X, y)
    856             Embedding of the training data in low-dimensional space.
    857         """
--> 858         embedding = self._fit(X)
    859         self.embedding_ = embedding
    860         return self.embedding_

C:\ProgramData\Anaconda3\lib\site-packages\sklearn\manifold\t_sne.py in _fit(self, X, skip_num_points)
    658         else:
    659             X = check_array(X, accept_sparse=['csr', 'csc', 'coo'],
--> 660                             dtype=[np.float32, np.float64])
    661         if self.method == 'barnes_hut' and self.n_components > 3:
    662             raise ValueError("'n_components' should be inferior to 4 for the "

C:\ProgramData\Anaconda3\lib\site-packages\sklearn\utils\validation.py in check_array(array, accept_sparse, dtype, order, copy, force_all_finite, ensure_2d, allow_nd, ensure_min_samples, ensure_min_features, warn_on_dtype, estimator)
    431                                       force_all_finite)
    432     else:
--> 433         array = np.array(array, dtype=dtype, order=order, copy=copy)
    434 
    435         if ensure_2d:

ValueError: setting an array element with a sequence.

2 个答案:

答案 0 :(得分:0)

假设我对您的理解正确,则需要将第一组包装在列表中;像这样的东西:

import numpy as np

#X = [[1,2,3],[4,5,6],[7,8,9]]
#y = [0,1,2,3,4,5,6, 7, 8, 9]

X = np.array([[1,2,3],[4,5,6],[7,8,9]])
y = np.array([0,1,2,3,4,5, 6, 7, 8, 9])

答案 1 :(得分:0)

array(list[1,2,3],list[4,5,6],list[7,8,9])

是一维对象dtype数组。从

[[1,2,3],[4,5,6],[7,8,9]]

需要多个np.array([[1,2,3],[4,5,6],[7,8,9]]);要么列表元素的大小有所不同,要么必须初始化一个对象数组并将列表值复制到其中。

在任何情况下,fit_transform无法处理这种数组。它需要一个二维数字dtype。注意check_array函数的参数。

如果X的所有列表元素的大小都相同,则

X = np.stack(X)

应将其转换为二维数值数组。

我怀疑X是保存之前的1d对象数组类型。 save/load本身不应将2维数字数组转换为对象1。