汇总多个文件中的列值

时间:2013-02-05 16:31:41

标签: python

我在这里遇到一个小问题,我试图从多个文件中总结条目(50),每个文件包含3列。 例如,使用前3个文件:file1.txt,file2.txt,file3.txt,如下所示:

FILE1.TXT:

2 3 4
1 5 6
5 4 7

FILE2.TXT:

1 2 1
2 3 2
4 3 1

file3.txt:

6 1 1
1 3 0
3 4 5

所以我的问题是如何总结50个文件中第一列,第二列和第三列的所有条目,最后得到一个看起来像的文件:

output.txt的:

9 6 6
4 11 8
12 11 13

我已经阅读了50个文件并附加了它们,但是我实际上无法逐个汇总这些条目。

所以我做到了:

for p in range(50):
    locals()['first_col%d' % p] = []
    locals()['second_col%d' % p] = []
    locals()['third_col%d' % i] = []

for i in range(1,50):
    f = open("file"+str(i)+".txt","r")
    for line in f:
        locals()['fist_col%d' % i].append(float(line.split()[0]))
        locals()['second_col%d' % i].append(float(line.split()[1]))
        locals()['third_col%d' % i].append(float(line.split()[2]))

f.close()

我正试图想办法把它放在一个循环中,该循环将读入所有first_cols(first_col1,first_col2,first_col3等),second_cols和third_cols并总结条目。

3 个答案:

答案 0 :(得分:2)

#!/usr/bin/python
b_list = []
for l in range(1,4):
    file=open('/Users/sgeorge/file%i.txt' % l, 'r')
    m1=[(i.strip()) for i in file]
    for j in m1:
        b_list.append(filter(None,[(k.strip()) for k in j]))
#print b_list
a = [[0,0,0],[0,0,0],[0,0,0]]
for i in range(0,9,3):
    a[0][0] += int(b_list[i][0])
    a[0][1] += int(b_list[i][1])
    a[0][2] += int(b_list[i][2])
for i in range(1,9,3):
    a[1][0] += int(b_list[i][0])
    a[1][1] += int(b_list[i][1])
    a[1][2] += int(b_list[i][2])

for i in range(2,9,3):
    a[2][0] += int(b_list[i][0])
    a[2][1] += int(b_list[i][1])
    a[2][2] += int(b_list[i][2])

for j in a:
    print j[0],j[1],j[2]

<强>输出:

$ python stack.py 
9 6 6
4 11 8
12 11 13

上述脚本仅用于处理三个文件(file1.txtfile2.txtfile3.txt

如果要处理50个此类文件,请使用以下命令:

#!/usr/bin/python
b_list = []
for l in range(1,51):
    file=open('/Users/sgeorge/file%i.txt' % l, 'r')
    m1=[(i.strip()) for i in file]
    for j in m1:
        b_list.append(filter(None,[(k.strip()) for k in j]))
#print b_list
a = [[0,0,0],[0,0,0],[0,0,0]]
for i in range(0,150,3):
    a[0][0] += int(b_list[i][0])
    a[0][1] += int(b_list[i][1])
    a[0][2] += int(b_list[i][2])
for i in range(1,150,3):
    a[1][0] += int(b_list[i][0])
    a[1][1] += int(b_list[i][1])
    a[1][2] += int(b_list[i][2])

for i in range(2,150,3):
    a[2][0] += int(b_list[i][0])
    a[2][1] += int(b_list[i][1])
    a[2][2] += int(b_list[i][2])

for j in a:
    print j[0],j[1],j[2]

<强>更新

>>> a=1
>>> b=1.1
>>> type(a)
<type 'int'>
>>> type(b)
<type 'float'>
>>> float(a)+float(b)
2.1
>>> 

我的上述脚本无法处理float个号码。要处理相同内容,请使用以下内容:

#!/usr/bin/python
b_list = []
for l in range(1,4):
    file=open('/Users/sgeorge/file%i.txt' % l, 'r')
    m1=[(i.strip()) for i in file]
    for j in m1:
        b_list.append(j.replace('\n','').split(' '))
#print b_list
a = [[0,0,0],[0,0,0],[0,0,0]]
for i in range(0,9,3):
    a[0][0] += float(b_list[i][0])
    a[0][1] += float(b_list[i][1])
    a[0][2] += float(b_list[i][2])
for i in range(1,9,3):
    a[1][0] += float(b_list[i][0])
    a[1][1] += float(b_list[i][1])
    a[1][2] += float(b_list[i][2])
for i in range(2,9,3):
    a[2][0] += float(b_list[i][0])
    a[2][1] += float(b_list[i][1])
    a[2][2] += float(b_list[i][2])
for j in a:
    print j[0],j[1],j[2]

<强>输出:

$ python stack.py 
9.0 6.0 6.0
4.0 11.0 8.0
12.0 11.0 13.0

答案 1 :(得分:0)

答案 2 :(得分:0)

In [1]: import numpy as np

In [2]: from StringIO import StringIO

In [3]: txt ="""2 3 4
   ...: 1 5 6
   ...: 5 4 7"""

In [4]: f = StringIO(txt)

In [5]: arr = np.loadtxt(f,dtype = int)

In [6]: np.sum(arr,axis = 0)
Out[6]: array([ 8, 12, 17])