python record.fromarrays错误"数组中的数组形状不匹配"

时间:2014-05-15 21:31:42

标签: python arrays numpy record

我将不胜感激任何帮助:)

我正在尝试从1d字符串数组创建一个记录数组 和2d数字数组(所以我可以使用np.savetxt并将其转储到文件中)。 不幸的是,文档没有提供信息:np.core.records.fromarrays

>>> import numpy as np
>>> x = ['a', 'b', 'c']
>>> y = np.arange(9).reshape((3,3))
>>> print x
['a', 'b', 'c']
>>> print y
[[0 1 2]
 [3 4 5]
 [6 7 8]]
>>> records = np.core.records.fromarrays([x,y])
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib/python2.7/dist-packages/numpy/core/records.py", line 560, in fromarrays
    raise ValueError, "array-shape mismatch in array %d" % k
ValueError: array-shape mismatch in array 1

我需要的输出是:

[['a', 0, 1, 2]
 ['b', 3, 4, 5]
 ['c', 6, 7, 8]]

1 个答案:

答案 0 :(得分:1)

如果您只想将xy转储到CSV文件,那么它就是not necessary to use a recarray。但是,如果您还有其他原因想要重新组合,那么您可以创建它:

import numpy as np
import numpy.lib.recfunctions as recfunctions

x = np.array(['a', 'b', 'c'], dtype=[('x', '|S1')])
y = np.arange(9).reshape((3,3))
y = y.view([('', y.dtype)]*3)

z = recfunctions.merge_arrays([x, y], flatten=True)
# [('a', 0, 1, 2) ('b', 3, 4, 5) ('c', 6, 7, 8)]

np.savetxt('/tmp/out', z, fmt='%s')

写入

a 0 1 2
b 3 4 5
c 6 7 8

/tmp/out


或者,要使用np.core.records.fromarrays,您需要单独列出y的每一列,因此传递给fromarrays的输入为the doc says,为&#34 ;数组的平面列表&#34;。

x = ['a', 'b', 'c']
y = np.arange(9).reshape((3,3))
z = np.core.records.fromarrays([x] + [y[:,i] for i in range(y.shape[1])])

传递给fromarrays的列表中的每个项目都将成为结果重新排列的一列。你可以通过检查the source code

来看到这一点
_array = recarray(shape, descr)

# populate the record array (makes a copy)
for i in range(len(arrayList)):
    _array[_names[i]] = arrayList[i]

return _array

顺便说一句,你可能想在这里使用pandas以获得额外的便利(不需要使用dtypes,展平或迭代所需的列):

import numpy as np
import pandas as pd

x = ['a', 'b', 'c']
y = np.arange(9).reshape((3,3))

df = pd.DataFrame(y)
df['x'] = x

print(df)
#    0  1  2  x
# 0  0  1  2  a
# 1  3  4  5  b
# 2  6  7  8  c

df.to_csv('/tmp/out')
# ,0,1,2,x
# 0,0,1,2,a
# 1,3,4,5,b
# 2,6,7,8,c