我有一个fortran格式化的txt文件,其中包含类似0.755473D-08
的数字。
如果我使用np.genfromtxt(data,dtype=None)
,则会显示b'0.755473D-08'
。我怎样才能摆脱b
?
答案 0 :(得分:1)
In [315]: txt = '''0.755473D-08
...: 0.755473D-08
...: 0.755473D-08'''
In [316]: np.genfromtxt(txt.splitlines())
Out[316]: array([nan, nan, nan])
In [317]: np.genfromtxt(txt.splitlines(),dtype=None)
...
Out[317]: array([b'0.755473D-08', b'0.755473D-08', b'0.755473D-08'], dtype='|S12')
使用字符串replace
:
In [319]: txt.replace('D','e')
Out[319]: '0.755473e-08\n0.755473e-08\n0.755473e-08'
In [320]: np.genfromtxt(_.splitlines())
Out[320]: array([7.55473e-09, 7.55473e-09, 7.55473e-09])
也可以逐行完成(从文件中读取时)。
使用转换器,应用于每个元素(每行一列):
In [326]: np.genfromtxt(txt.splitlines(), converters={0:lambda x:float(x.replace('D','e'))}, encoding=None)
Out[326]: array([7.55473e-09, 7.55473e-09, 7.55473e-09])
它不会尝试在转换后进行任何进一步的dtype
转换,因此我必须在转换器中包含float()
。