Question

我正在使用Fortran 90来读取包含以下格式的数据的文件

number# 125 var1= 2 var2= 1 var3: 4
        .
        .
        .
        .
number# 234 var1= 3 var2= 5 var3: 1

我尝试了以下命令并且工作正常

read (2,*)  tempstr , my_param(1), tempstr , my_param(2), tempstr , my_param(3)

问题是当数字变大并且字符串和数字之间没有空格时，即数据看起来如下：

number# 125 var1= 2 var2=124 var3: 4

我试过

     read (2,512)  my_param(1), my_param(2), my_param(3)

512 format('number#', i, 'var1=', i, 'var2=', i, 'var3:', i)

它将所有数字读为零

我无法切换到其他语言。数据集很大，所以我无法对其进行预处理。而且，分隔符每次都不一样。有人可以帮忙解决这个问题吗？

提前致谢

Answer 1

首先，720,000行对于预处理来说并不算太多。像sed和awk这样的工具主要是逐行工作的，因此它们可以很好地扩展。

我实际做的是以我可以使用名单的方式转换数据：

$ cat preprocess.sed

# Add commas between values
# Space followed by letter -> insert comma
s/ \([[:alpha:]]\)/ , \1/g

# "number" is a key word in Fortran, so replace it with num
s/number/num/g

# Replace all possible data delimitors with the equals character
s/[#:]/=/g

# add the '&mydata' namelist descriptor to the beginning
s/^/\&mydata /1

# add the namelist closing "/" character to the end of the line:
s,$,/,1

$ sed -f preprocess.sed < data.dat > data.nml

检查数据是否已正确预处理：

$ tail -3 data.dat
number#1997 var1=114 var2=130 var3:127
number#1998 var1=164 var2=192 var3: 86
number#1999 var1=101 var2= 48 var3:120

$ tail -3 data.nml
&mydata num=1997 , var1=114 , var2=130 , var3=127/
&mydata num=1998 , var1=164 , var2=192 , var3= 86/
&mydata num=1999 , var1=101 , var2= 48 , var3=120/

然后你可以用这个fortran程序阅读它：

program read_mixed
    implicit none
    integer :: num, var1, var2, var3
    integer :: io_stat
    namelist /mydata/ num, var1, var2, var3

    open(unit=100, file='data.nml', status='old', action='read')
    do
        read(100, nml=mydata, iostat=io_stat)
        if (io_stat /= 0) exit
        print *, num, var1, var2, var3
    end do
    close(100)
end program read_mixed

Answer 2

虽然我仍然坚持我的原始答案，特别是因为输入数据已经非常接近名单文件的样子，但我们假设您事先无法对数据进行任何预处理。

接下来最好的事情是将整行读入var k = aa; if(k == "aa") { // run something } else { // negate an external script }变量，然后使用String Manipulation从中提取值。像这样：

character(len=<enough>)

请注意，我没有包含任何错误/健全性检查。我会把它留给你。

Fortran阅读混合文本和数字

2 个答案: