Question

我有一个想要读入Python的二进制文件。该文件由三部分组成：波数列表，温度列表以及作为温度和压力函数的不透明度列表。我想将前两个导入为矢量a和b，第三个导入为二维数组c，使得c [x，y]对应于[x]和b [y]。

现有的FORTRAN90代码能够实现如下：

integer   nS, nT
parameter (nS = 3000)
parameter (nT = 9)

real(8) wn_arr(nS)      ! wavenumber [cm^-1]
real(8) temp_arr(nT)    ! temperature [K]
real(8) abs_arr(nS,nT)  ! absorption coefficient [cm^-1 / amagat^2]

open(33,file=trim(datadir)//'CO2_dimer_data',form='unformatted')
read(33) wn_arr
read(33) temp_arr
read(33) abs_arr
close(33)

我尝试了以下python代码：

f=scipy.io.FortranFile('file', 'r')
a_ref=f.read_reals(np.float64) #wavenumber (cm**-1)
b=f.read_reals(np.float64) #temperature (K)
c=f.read_reals(np.float64).reshape((3000,9))

但是，这会产生不正确的结果。我怀疑这是因为Fortran以不同于Python的顺序将数组写入文件。但是，只需添加订单=＆＃39; F＆＃39;重塑命令不起作用。我怀疑这是因为在读入时，abscoeff_ref已经被夷为平地。

有什么想法吗？

Answer 1

为了让你知道我在第二次评论中的意思，我做了一个模拟：

testwrite.f90，使用gfortran 4.8.4编译：它基本上写了一个未经格式化的顺序文件，其中包含您指定的数组（只需要很小，以便能够通过眼睛比较它们）填充任意数据。它还会打印数组。

implicit none
integer   nS, nT, i ,j
parameter (nS = 10)
parameter (nT = 3)

real(8) wn_arr(nS)      ! wavenumber [cm^-1]
real(8) temp_arr(nT)    ! temperature [K]
real(8) abs_arr(nS,nT)  ! absorption coefficient [cm^-1 / amagat^2]

wn_arr = (/ (i, i=1,nS) /)
temp_arr = (/ (270+i, i=1,nT) /)
abs_arr = reshape( (/ ((10*j+i, i=1,nS), j=1,nT) /), (/nS, nT/))

print*, wn_arr
print*, '-----------------'
print*, temp_arr
print*, '-----------------'
print*, abs_arr
print*, '-----------------'
print*, 'abs_arr(5,3) = ', abs_arr(5,3)

open(33,file='test.out',form='unformatted')
write(33) wn_arr
write(33) temp_arr
write(33) abs_arr
close(33)

end

testread.py，使用Python 2.7.6测试，然后读取上面写的文件并打印数组。对我来说，两个程序的输出是相同的。 YMMV。

import numpy as np

rec_delim = 4  # This value depends on the Fortran compiler
nS = 10
nT = 3

with open('test.out', 'rb') as infile:
    infile.seek(rec_delim, 1)  # begin record
    wn_arr = np.fromfile(file=infile, dtype=np.float64, count=nS)
    infile.seek(rec_delim, 1)  # end record
    infile.seek(rec_delim, 1)  # begin record
    temp_arr = np.fromfile(file=infile, dtype=np.float64, count=nT)
    infile.seek(rec_delim, 1)  # end record
    infile.seek(rec_delim, 1)  # begin record
    abs_arr = np.fromfile(file=infile,
                        dtype=np.float64).reshape((nS, nT), order='F')
    infile.seek(rec_delim, 1)  # end record

print(wn_arr)
print(temp_arr)
print(abs_arr)
# The array has the same shape, but Fortran starts index (per default at least)
# at 1 and Python at 0:
print('abs_arr(5,3) = ' + str(abs_arr[4,2]))

简短说明：我在with-block中打开文件（Python中的好习惯），然后使用文件编写方式的知识逐步浏览文件。这使它无法移植。 infile.seek（4,1）将Python的读指针从当前位置（选项1）向前移动4个字节，因为我知道该文件以一个4字节长的开始记录标记开始（gfortran）。

然后我使用numpy.fromfile来读取count = 10的float64值，这是波数数组。

接下来，我必须跳过结束记录和开始记录标记。这当然可以通过infile.seel（8,1）来完成。

然后我读取温度数组，再次跳过结束记录和开始记录标记并读取2D数组。文件中的数据不知道它是2D，所以我需要使用Fortran-order重新整形。最后一个.seek（）是虚假的，我只想强调结构。

我强烈建议您不要在这样的代码上构建更大的系统。这对于一次性来说很好，但对于你必须再次使用或分享的东西来说很糟糕。

将FORTRAN90文件生成的数据读入NUMPY数组

1 个答案: