我有一系列时间温度数据:
ifile.txt
1921 25
1922 25.1
1923 24.2
1924 23.4
1925 24.4
1926 25.1
1927 23.6
1928 25.2
1929 23.9
1930 25.6
我想计算1923-1929期间的趋势。
我的算法是:
将上述点放在
之类的行上Y = mX + c ; where m is the trend
我可以找到整个时期的趋势,但在选择特定时期时我无法修改我的脚本。你能查一下我的剧本吗?
awk '/1923/,/1929/ {if (NR==FNR) x[NR] = $1;y[NR] = $2;
sx += x[NR]; sy += y[NR];
sxx += x[NR]*x[NR];
sxy += x[NR]*y[NR];}
END{
det = NR*sxx - sx*sx;
trend = (NR*sxy - sx*sy)/det;
print trend;}' ifile.txt
打印不正确。
The correct value is 0.0679
答案 0 :(得分:2)
你可以稍微简化它,你不计算匹配的记录。 NR
将是END块中的总行数。
awk '/1923/,/1929/ {sx+=$1; sy+=$2; c++;
sxx+=$1*$1; sxy+=$1*$2}
END {det=c*sxx-sx*sx;
print det?(c*sxy-sx*sy)/det:"DIV0"}' file
还需要考虑分母为零。这个趋势出现了
0.0678571