Python IO:使用格式说明符读取文件

时间:2013-02-02 22:26:24

标签: python format

我想在一个非常糟糕的文本文件中读取,因为每行中的值有时不用空格或逗号分隔(所以我不能使用.split())。我想像在FORTRAN中那样阅读它,在那里我告诉它每个值的确切位置。这就是我想要的。有谁知道更好的方法来做到这一点?谢谢!

f=open('f.out','r')

lines = f.readlines()

nLines = len(lines)
data = {}


keys = {'SPE':[0, 2, np.int],              #I2
      'SPEISO':[2, 3, np.int],         #I1
      'wnum':[3,15, np.float64],       #F12.6
      'S':[15, 25, np.float64],     #E10.3
      'Ecoeff':[25, 35, np.float64],     #E10.3
      'AGA':[35, 40, np.float64],     #F5.5
      'SGA':[40, 45, np.float64],     #F5.4
      'ELO':[45, 55, np.float64],     #F10.4
      'N'  :[55, 59, np.float64],     #F4.2
      'FSH':[59, 67, np.float64],     #F8.6
      'TRS':[67, 127, np.str],
      'IERR': [127, 133, np.int],
      'IEFF': [133, 145, np.str],
      'other': [145,160, np.str]  }

for k in keys:
  data[k] = np.zeros(nLines)

for i, l in enumerate(lines):
 print i
  for k in keys:
    print k
    data[[k][i]] = l.format(keys[k])

1 个答案:

答案 0 :(得分:1)

您可以使用read_fwf库中的pandas功能。

类似的东西:

import pandas
pandas.read_fwf('f.out', 
   colspecs=[x[:2] for x in keys.values()],
   dtype=[x[2] for x in keys.values()]
   )