我正在使用Pandas来生成一些信息和功能。我将使用该数据库作为sklearn的输入。目前,我正在使用.as_matrix()
将数据帧转换为数组。以下是输出:
array([[0.4437294900417328, 0.13434134423732758, 0.474, 0.482,
array([0, 0, 0, 0, 0, 0, 1, 0, 0, 0])],
[0.09896088391542435, 0.10105254501104355, 0.474, 0.526,
array([0, 0, 0, 0, 0, 1, 0, 0, 0, 0])],
[0.026971107348799706, 0.08766224980354309, 0.474, 0.581,
array([0, 0, 0, 0, 0, 0, 1, 0, 0, 0])],
...,
我想将这个内部数组解析为父2D数组。结果看起来应该是这样的。
array([[0.4437294900417328, 0.13434134423732758, 0.474, 0.482,
0, 0, 0, 0, 0, 0, 1, 0, 0, 0],
[0.09896088391542435, 0.10105254501104355, 0.474, 0.526,
0, 0, 0, 0, 0, 1, 0, 0, 0, 0],
[0.026971107348799706, 0.08766224980354309, 0.474, 0.581,
0, 0, 0, 0, 0, 0, 1, 0, 0, 0],
...,
TIA
答案 0 :(得分:0)
正如我评论的那样,阵列的确切结构尚不清楚。我确定外部dtype是对象。熊猫经常使用它来保存混合数据。
这是猜测,可能的解决方案:
创建一个对象数组并用一些浮点数和整数数组填充它:
In [38]: A=np.empty((3,5),dtype=object)
In [39]: A[:,:4]=np.arange(12.).reshape(3,4)/10
In [40]: A[0,-1]=np.arange(5)
In [41]: A[1,-1]=np.arange(1,6)
In [42]: A[2,-1]=np.arange(2,7)
In [43]: A
Out[43]:
array([[0.0, 0.1, 0.2, 0.3, array([0, 1, 2, 3, 4])],
[0.4, 0.5, 0.6, 0.7, array([1, 2, 3, 4, 5])],
[0.8, 0.9, 1.0, 1.1, array([2, 3, 4, 5, 6])]], dtype=object)
打印类似。 reshape
,concatenate
,ravel
等不加入浮点数和数组。
而是让数组保存预期的值,并将它们复制到它:
In [44]: B=np.zeros((3,9),float)
In [45]: B[:,:4]=A[:,:4]
复制浮动列很容易。但是,将数组重新编写为可以作为块复制的内容,需要连接。 vstack
形式似乎可以解决问题:
In [46]: B[:,4:]=np.vstack(A[:,-1])
In [47]: B
Out[47]:
array([[ 0. , 0.1, 0.2, 0.3, 0. , 1. , 2. , 3. , 4. ],
[ 0.4, 0.5, 0.6, 0.7, 1. , 2. , 3. , 4. , 5. ],
[ 0.8, 0.9, 1. , 1.1, 2. , 3. , 4. , 5. , 6. ]])
我必须根据我对数组显示的了解重新创建数组,包括对象类型。然后我不得不四处游玩,尝试各种方式加入价值观。所以有很多试验和错误。