我有一个想要读入Python的二进制文件。该文件由三部分组成:波数列表,温度列表以及作为温度和压力函数的不透明度列表。我想将前两个导入为矢量a和b,第三个导入为二维数组c,使得c [x,y]对应于[x]和b [y]。
现有的FORTRAN90代码能够实现如下:
integer nS, nT
parameter (nS = 3000)
parameter (nT = 9)
real(8) wn_arr(nS) ! wavenumber [cm^-1]
real(8) temp_arr(nT) ! temperature [K]
real(8) abs_arr(nS,nT) ! absorption coefficient [cm^-1 / amagat^2]
open(33,file=trim(datadir)//'CO2_dimer_data',form='unformatted')
read(33) wn_arr
read(33) temp_arr
read(33) abs_arr
close(33)
我尝试了以下python代码:
f=scipy.io.FortranFile('file', 'r')
a_ref=f.read_reals(np.float64) #wavenumber (cm**-1)
b=f.read_reals(np.float64) #temperature (K)
c=f.read_reals(np.float64).reshape((3000,9))
但是,这会产生不正确的结果。我怀疑这是因为Fortran以不同于Python的顺序将数组写入文件。但是,只需添加订单=' F'重塑命令不起作用。我怀疑这是因为在读入时,abscoeff_ref已经被夷为平地。
有什么想法吗?
答案 0 :(得分:2)
为了让你知道我在第二次评论中的意思,我做了一个模拟:
testwrite.f90,使用gfortran 4.8.4编译:它基本上写了一个未经格式化的顺序文件,其中包含您指定的数组(只需要很小,以便能够通过眼睛比较它们)填充任意数据。 它还会打印数组。
implicit none
integer nS, nT, i ,j
parameter (nS = 10)
parameter (nT = 3)
real(8) wn_arr(nS) ! wavenumber [cm^-1]
real(8) temp_arr(nT) ! temperature [K]
real(8) abs_arr(nS,nT) ! absorption coefficient [cm^-1 / amagat^2]
wn_arr = (/ (i, i=1,nS) /)
temp_arr = (/ (270+i, i=1,nT) /)
abs_arr = reshape( (/ ((10*j+i, i=1,nS), j=1,nT) /), (/nS, nT/))
print*, wn_arr
print*, '-----------------'
print*, temp_arr
print*, '-----------------'
print*, abs_arr
print*, '-----------------'
print*, 'abs_arr(5,3) = ', abs_arr(5,3)
open(33,file='test.out',form='unformatted')
write(33) wn_arr
write(33) temp_arr
write(33) abs_arr
close(33)
end
testread.py,使用Python 2.7.6测试,然后读取上面写的文件并打印数组。对我来说,两个程序的输出是相同的。 YMMV。
import numpy as np
rec_delim = 4 # This value depends on the Fortran compiler
nS = 10
nT = 3
with open('test.out', 'rb') as infile:
infile.seek(rec_delim, 1) # begin record
wn_arr = np.fromfile(file=infile, dtype=np.float64, count=nS)
infile.seek(rec_delim, 1) # end record
infile.seek(rec_delim, 1) # begin record
temp_arr = np.fromfile(file=infile, dtype=np.float64, count=nT)
infile.seek(rec_delim, 1) # end record
infile.seek(rec_delim, 1) # begin record
abs_arr = np.fromfile(file=infile,
dtype=np.float64).reshape((nS, nT), order='F')
infile.seek(rec_delim, 1) # end record
print(wn_arr)
print(temp_arr)
print(abs_arr)
# The array has the same shape, but Fortran starts index (per default at least)
# at 1 and Python at 0:
print('abs_arr(5,3) = ' + str(abs_arr[4,2]))
简短说明:我在with-block中打开文件(Python中的好习惯),然后使用文件编写方式的知识逐步浏览文件。这使它无法移植。 infile.seek(4,1)将Python的读指针从当前位置(选项1)向前移动4个字节,因为我知道该文件以一个4字节长的开始记录标记开始(gfortran) 。
然后我使用numpy.fromfile来读取count = 10的float64值,这是波数数组。
接下来,我必须跳过结束记录和开始记录标记。这当然可以通过infile.seel(8,1)来完成。
然后我读取温度数组,再次跳过结束记录和开始记录标记并读取2D数组。 文件中的数据不知道它是2D,所以我需要使用Fortran-order重新整形。 最后一个.seek()是虚假的,我只想强调结构。
我强烈建议您不要在这样的代码上构建更大的系统。这对于一次性来说很好,但对于你必须再次使用或分享的东西来说很糟糕。