我对包numpy.genfromtxt有一个奇怪的问题。我用它来读取包含多个列的数据文件(可用here),但即使unpack
设置为True
,这些也不会被解压缩。
这是MWE
:
import numpy as np
f_data = np.genfromtxt('file.dat', dtype=None, unpack=True)
print f_data[3]
(237, 304.172, 2017.48, 15.982, 0.005, 0.889, 0.006, -2.567, 0.004, 1.205, 0.006)
(我使用dtype=None
因为文件可以散布在各处)
如您所见,它返回一行而不是一个解压缩的列。
如果我使用np.loadtxt
,它会按预期工作:
f_data = np.loadtxt('file.dat', unpack=True)
print f_data[3]
[ 16.335 16.311 15.674 15.982 16.439 15.903 15.313 18.35 15.643 14.081 16.578 11.477]
我在这里做错了什么?
答案 0 :(得分:2)
这是你想要的吗?
In [448]: i=3
...: d=np.genfromtxt(fname, None) #d is a recorded array (or structured array)
...: d['f%d'%i] #Addressing Array Columns by Name
Out[448]: array([ 16.335, 16.311, 15.674, 15.982, 16.439, 15.903])
见:
http://wiki.scipy.org/Cookbook/Recarray
http://docs.scipy.org/doc/numpy/user/basics.rec.html#module-numpy.doc.structured_arrays
我在以下数据上测试了d=np.genfromtxt('a.x', dtype=None, unpack=True)
:
144 a578.06 873.72 16.335 0.003
#-------^--------
180 593.41 665.748 16.311 0.003
147 868.769 908.472 15.674 0.003
237 asdf.172 2017.48 15.982 0.005
#-------^--------
dtype=None
,unpack确实失败了:
In [538]: d=np.genfromtxt('a.x', dtype=None, unpack=True)
...: print d[3]
...: print d[1]
(237, 'asdf.172', 2017.48, 15.982, 0.005)
(180, '593.41', 665.748, 16.311, 0.003)
在使用default dtype
或dtype=str
时,解包有效:
In [539]: d=np.genfromtxt('a.x', unpack=True)
...: print d[3]
...: print d[1]
[ 16.335 16.311 15.674 15.982 16.439 15.903]
[ nan 593.41 868.769 nan 1039.71 385.864]
In [540]: d=np.genfromtxt('a.x', dtype=str, unpack=True)
...: print d[3]
...: print d[1]
['16.335' '16.311' '15.674' '15.982' '16.439' '15.903']
['a578.06' '593.41' '868.769' 'asdf.172' '1039.71' '385.864']
答案 1 :(得分:0)
更改
dtype=None
到
dtype=str
并删除解包,因为这将转置数据。并且为了良好的实践添加分隔符:)