我在IDL中有一个脚本,它读取一个未格式化的二进制文件(F77)并将其输出为.sav文件,但我想将此脚本转换为python并保存为.npz文件,我在阅读时遇到问题线。
IDL代码:
;create save file for QBO model output
;---------------------------------------------------------------------
;input data here (Only adjust this info)
;---------------------------------------------------------------------
time=7300 ;duration from fortran code
tstep=5 ;time step from fortran code
inputfile='/home/cwilliams/Metr_205/qbo/uvwtom.'; binary file from fortran
outputsavefile='~cwilliams/Metr_205/qbo/qbo_FULLX.sav'; name of save file with variables
;--------------------------------------------------------------------------------
;--------------------------------------------------------------------------------
;==============================================================================
; Do Not Adjust the Following Code
;==============================================================================
fname='dat'
nstep=time/tstep ;time/timestep
nm=nstep-1
um=fltarr(17,34)
vm=fltarr(17,34)
wm=fltarr(17,34)
tm=fltarr(17,34)
pm=fltarr(17,34)
om=fltarr(17,34)
vpm=fltarr(17,34)
vdm=fltarr(17,34)
u=fltarr(17,34,nstep)
v=fltarr(17,34,nstep)
w=fltarr(17,34,nstep)
temp=fltarr(17,34,nstep)
pressure=fltarr(17,34,nstep)
ozone=fltarr(17,34,nstep)
date=findgen(nstep)*(2.*tstep/365.)
ulevels2=[-30, -25, -20, -15, -10, -5, 5, 10, 15, 20, 25, 30]
ulevels3=findgen(15)*3.-12
lab=findgen(20)*0+1
lat=findgen(17)*2.7-1.35
ht=findgen(34)*0.5+17.
openr,37,inputfile+fname,/f77_unformatted & title='base'
for n=0,nm do begin
readu,37,um,vm,wm,tm,om,pm
u(*,*,n)=um/100.
v(*,*,n)=vm
w(*,*,n)=wm
temp(*,*,n)=tm*700000./2.87e6
pressure(*,*,n)=pm/10000.
ozone(*,*,n)=om
endfor
close,37
save,filename=outputsavefile,u,v,w,temp,pressure,ozone,date,ulevels2,ulevels3,lab,$
lat,ht
stop
end
Python代码: #create保存文件以进行QBO模型输出
#---------------------------------------------------------------------
#input data here (Only adjust this info)
#---------------------------------------------------------------------
time=7300 #duration from fortran code
tstep=5 #time step from fortran code
inputfile='/home/cwilliams/metr51/lab12/uvwtom.dat'# binary file from fortran
outputsavefile='~cwilliams/metr51/lab12/qbo_FULLX.sav'# name of save file with variables
#--------------------------------------------------------------------------------
#--------------------------------------------------------------------------------
import numpy as n
#==============================================================================
# Do Not Adjust the Following Code
#==============================================================================
nstep=time/tstep #time/timestep
nm=nstep-1
um=n.empty((17,34))
vm=n.empty((17,34))
wm=n.empty((17,34))
tm=n.empty((17,34))
pm=n.empty((17,34))
om=n.empty((17,34))
vpm=n.empty((17,34))
vdm=n.empty((17,34))
u=n.empty((17,34,nstep))
v=n.empty((17,34,nstep))
w=n.empty((17,34,nstep))
temp=n.empty((17,34,nstep))
pressure=n.empty((17,34,nstep))
ozone=n.empty((17,34,nstep))
date=n.arange(nstep)*(2.*tstep/365.)
ulevels2=n.array([-30, -25, -20, -15, -10, -5, 5, 10, 15, 20, 25, 30])
ulevels3=n.arange(15)*3.-12
lab=n.arange(20)*0+1
lat=n.arange(17)*2.7-1.35
ht=n.arange(34)*0.5+17.
这是我需要一些帮助的地方:
f=open(inputfile,'rb')
data=f.read()
for i in range(nm+1):
# readu,37,um,vm,wm,tm,om,pm
# u(:,:,i)=um/100.
# v(:,:,i)=vm
# w(:,:,i)=wm
# temp(:,:,i)=tm*700000./2.87e6
# pressure(:,:,i)=pm/10000.
# ozone(*,*,n)=om
#
#n.savez(filename=outputsavefile,u=u,v=v,w=w,temp=temp,pressure=pressure,ozone=ozone,date=date,ulevels2=ulevels2,ulevels3=ulevels3,lab=lab,lat=lat,ht=ht)
我知道IDL和Python之间的行/列顺序存在问题,但我想我可以在读取代码后解决这个问题。
答案 0 :(得分:2)
首先,我必须假设您使用顺序访问而非直接访问来编写原始Fortran文件,这是一个非常重要的区别。我知道IDL和您在示例中设置的读取命令与顺序访问一致。
这很重要,因为Fortran顺序访问添加了记录标记'对于每次调用WRITE()的文件,所以你必须在你的Python读取例程中考虑到这一点,就像乔治在评论中链接的答案一样。
对于行/列顺序,确实哪个维度在内存中迭代最快是很重要的。例如,Fortran 2D数组将在内存中写入第一个数组维度作为最快的迭代。当您将相同的内容读入2D Python变量时,它将是最后一个维度 - 在重塑平面数组时请记住这一点,如果您想保留索引,则必须转置它。
我认为以下代码将大致完成您想要的操作,为简洁起见,我只包含了您的um和vm变量:
import numpy as np
um=np.empty((34,17), dtype='float32') # Make these dimensions "backwards" for easier reshaping
vm=np.empty((34,17), dtype='float32') # Also watch out, I believe the default type is float64
f = open(inputfile,'rb')
recl = np.zeros(1,dtype=np.uint32)
for i in range(nm+1):
recl = np.fromfile(f, dtype='uint32', count=1)
tmpu = np.fromfile(f, dtype='float32', count=um.size) # These arrays will be flat
tmpv = np.fromfile(f, dtype='float32', count=vm.size)
recl = np.fromfile(f, dtype='uint32', count=1)
um = np.transpose(np.reshape(tmpu, um.shape))
vm = np.transpose(np.reshape(tmpv, vm.shape))
然后你也可以在循环中用你的其他变量做任何你想做的事情,你应该能够像在IDL或Fortran中那样使用um和vm。这可能不是最简单或最好的方法,但我认为它至少可以让你开始。