在python2中加载保存在python3中的numpy结构化数组

时间:2015-04-17 14:58:53

标签: python-2.7 python-3.x numpy

似乎无法在python2中加载保存在python3中的numpy结构化数组,因为字段名称是unicode字符串。

$ python3
Python 3.4.0 (default, Apr 11 2014, 13:05:11) 
>>> a = np.zeros(4, dtype=[('x',int)])
>>> np.save('a.npy', {'a': a})
>>> 
$ python2
Python 2.7.6 (default, Mar 22 2014, 22:59:56) 
>>> np.load('a.npy')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/local/lib/python2.7/dist-packages/numpy/lib/npyio.py", line 393, in load
    return format.read_array(fid)
  File "/usr/local/lib/python2.7/dist-packages/numpy/lib/format.py", line 602, in read_array
array = pickle.load(fp)
ValueError: non-string names in Numpy dtype unpickling

在相当长的一段时间里,这是一个numpy bug: https://github.com/numpy/numpy/issues/2407

有没有人能够在python2中从python3加载numpy结构化数组(无需在python3中加载和重新保存)?

1 个答案:

答案 0 :(得分:1)

我认为这不是unicode字段名称问题。

在python3中,我可以保存object数组:

In [133]: b=np.array([[1],[1,2],[1,2,3]])
In [134]: np.save('a.npy',b)
In [135]: np.load('a.npy')
Out[135]: array([[1], [1, 2], [1, 2, 3]], dtype=object)

在python2中

In [260]: np.load('a.npy')
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-260-76b2da2985df> in <module>()
----> 1 np.load('a.npy')

/usr/local/lib/python2.7/site-packages/numpy/lib/npyio.pyc in load(file, mmap_mode)
    386                 return format.open_memmap(file, mode=mmap_mode)
    387             else:
--> 388                 return format.read_array(fid)
    389         else:
    390             # Try a pickle

/usr/local/lib/python2.7/site-packages/numpy/lib/format.pyc in read_array(fp)
    451     if dtype.hasobject:
    452         # The array contained Python objects. We need to unpickle the data.
--> 453         array = pickle.load(fp)
    454     else:
    455         if isfileobj(fp):

TypeError: must be char, not unicode

错误不在同一个地方,但仍然涉及pickle.load。如果我保存{'a':a},我会收到相同的错误。

使用字典包装器,python3 load获取

array({'a': array([(0,), (0,), (0,), (0,)], 
      dtype=[('x', '<i4')])}, dtype=object)

正如moamingsun所指出的,如果你保存a数组而不使用字典包装器,python2加载工作正常。

问题不在于字段名称,而在于使用Python 3 v 2酸洗。如果必须保存Python对象,np.save会将降压传递给pickle。我确信py2 v 3酸洗兼容性已在其他地方深入讨论过。