我正在使用Fortran 90来读取包含以下格式的数据的文件
number# 125 var1= 2 var2= 1 var3: 4
.
.
.
.
number# 234 var1= 3 var2= 5 var3: 1
我尝试了以下命令并且工作正常
read (2,*) tempstr , my_param(1), tempstr , my_param(2), tempstr , my_param(3)
问题是当数字变大并且字符串和数字之间没有空格时,即数据看起来如下:
number# 125 var1= 2 var2=124 var3: 4
我试过
read (2,512) my_param(1), my_param(2), my_param(3)
512 format('number#', i, 'var1=', i, 'var2=', i, 'var3:', i)
它将所有数字读为零
我无法切换到其他语言。数据集很大,所以我无法对其进行预处理。而且,分隔符每次都不一样。 有人可以帮忙解决这个问题吗?
提前致谢
答案 0 :(得分:3)
首先,720,000行对于预处理来说并不算太多。像sed
和awk
这样的工具主要是逐行工作的,因此它们可以很好地扩展。
我实际做的是以我可以使用名单的方式转换数据:
$ cat preprocess.sed
# Add commas between values
# Space followed by letter -> insert comma
s/ \([[:alpha:]]\)/ , \1/g
# "number" is a key word in Fortran, so replace it with num
s/number/num/g
# Replace all possible data delimitors with the equals character
s/[#:]/=/g
# add the '&mydata' namelist descriptor to the beginning
s/^/\&mydata /1
# add the namelist closing "/" character to the end of the line:
s,$,/,1
$ sed -f preprocess.sed < data.dat > data.nml
检查数据是否已正确预处理:
$ tail -3 data.dat
number#1997 var1=114 var2=130 var3:127
number#1998 var1=164 var2=192 var3: 86
number#1999 var1=101 var2= 48 var3:120
$ tail -3 data.nml
&mydata num=1997 , var1=114 , var2=130 , var3=127/
&mydata num=1998 , var1=164 , var2=192 , var3= 86/
&mydata num=1999 , var1=101 , var2= 48 , var3=120/
然后你可以用这个fortran程序阅读它:
program read_mixed
implicit none
integer :: num, var1, var2, var3
integer :: io_stat
namelist /mydata/ num, var1, var2, var3
open(unit=100, file='data.nml', status='old', action='read')
do
read(100, nml=mydata, iostat=io_stat)
if (io_stat /= 0) exit
print *, num, var1, var2, var3
end do
close(100)
end program read_mixed
答案 1 :(得分:2)
虽然我仍然坚持我的原始答案,特别是因为输入数据已经非常接近名单文件的样子,但我们假设您事先无法对数据进行任何预处理。
接下来最好的事情是将整行读入var k = aa;
if(k == "aa") {
// run something
} else {
// negate an external script
}
变量,然后使用String Manipulation从中提取值。像这样:
character(len=<enough>)
请注意,我没有包含任何错误/健全性检查。我会把它留给你。