Question

我在这里遇到一个小问题，我试图从多个文件中总结条目（50），每个文件包含3列。例如，使用前3个文件：file1.txt，file2.txt，file3.txt，如下所示：

FILE1.TXT：

2 3 4
1 5 6
5 4 7

FILE2.TXT：

1 2 1
2 3 2
4 3 1

file3.txt：

6 1 1
1 3 0
3 4 5

所以我的问题是如何总结50个文件中第一列，第二列和第三列的所有条目，最后得到一个看起来像的文件：

output.txt的：

9 6 6
4 11 8
12 11 13

我已经阅读了50个文件并附加了它们，但是我实际上无法逐个汇总这些条目。

所以我做到了：

for p in range(50):
    locals()['first_col%d' % p] = []
    locals()['second_col%d' % p] = []
    locals()['third_col%d' % i] = []

for i in range(1,50):
    f = open("file"+str(i)+".txt","r")
    for line in f:
        locals()['fist_col%d' % i].append(float(line.split()[0]))
        locals()['second_col%d' % i].append(float(line.split()[1]))
        locals()['third_col%d' % i].append(float(line.split()[2]))

f.close()

我正试图想办法把它放在一个循环中，该循环将读入所有first_cols（first_col1，first_col2，first_col3等），second_cols和third_cols并总结条目。

Answer 1

#!/usr/bin/python
b_list = []
for l in range(1,4):
    file=open('/Users/sgeorge/file%i.txt' % l, 'r')
    m1=[(i.strip()) for i in file]
    for j in m1:
        b_list.append(filter(None,[(k.strip()) for k in j]))
#print b_list
a = [[0,0,0],[0,0,0],[0,0,0]]
for i in range(0,9,3):
    a[0][0] += int(b_list[i][0])
    a[0][1] += int(b_list[i][1])
    a[0][2] += int(b_list[i][2])
for i in range(1,9,3):
    a[1][0] += int(b_list[i][0])
    a[1][1] += int(b_list[i][1])
    a[1][2] += int(b_list[i][2])

for i in range(2,9,3):
    a[2][0] += int(b_list[i][0])
    a[2][1] += int(b_list[i][1])
    a[2][2] += int(b_list[i][2])

for j in a:
    print j[0],j[1],j[2]

<强>输出：

$ python stack.py 
9 6 6
4 11 8
12 11 13

上述脚本仅用于处理三个文件（file1.txt，file2.txt和file3.txt）

如果要处理50个此类文件，请使用以下命令：

#!/usr/bin/python
b_list = []
for l in range(1,51):
    file=open('/Users/sgeorge/file%i.txt' % l, 'r')
    m1=[(i.strip()) for i in file]
    for j in m1:
        b_list.append(filter(None,[(k.strip()) for k in j]))
#print b_list
a = [[0,0,0],[0,0,0],[0,0,0]]
for i in range(0,150,3):
    a[0][0] += int(b_list[i][0])
    a[0][1] += int(b_list[i][1])
    a[0][2] += int(b_list[i][2])
for i in range(1,150,3):
    a[1][0] += int(b_list[i][0])
    a[1][1] += int(b_list[i][1])
    a[1][2] += int(b_list[i][2])

for i in range(2,150,3):
    a[2][0] += int(b_list[i][0])
    a[2][1] += int(b_list[i][1])
    a[2][2] += int(b_list[i][2])

for j in a:
    print j[0],j[1],j[2]

<强>更新

>>> a=1
>>> b=1.1
>>> type(a)
<type 'int'>
>>> type(b)
<type 'float'>
>>> float(a)+float(b)
2.1
>>>

我的上述脚本无法处理float个号码。要处理相同内容，请使用以下内容：

#!/usr/bin/python
b_list = []
for l in range(1,4):
    file=open('/Users/sgeorge/file%i.txt' % l, 'r')
    m1=[(i.strip()) for i in file]
    for j in m1:
        b_list.append(j.replace('\n','').split(' '))
#print b_list
a = [[0,0,0],[0,0,0],[0,0,0]]
for i in range(0,9,3):
    a[0][0] += float(b_list[i][0])
    a[0][1] += float(b_list[i][1])
    a[0][2] += float(b_list[i][2])
for i in range(1,9,3):
    a[1][0] += float(b_list[i][0])
    a[1][1] += float(b_list[i][1])
    a[1][2] += float(b_list[i][2])
for i in range(2,9,3):
    a[2][0] += float(b_list[i][0])
    a[2][1] += float(b_list[i][1])
    a[2][2] += float(b_list[i][2])
for j in a:
    print j[0],j[1],j[2]

<强>输出：

$ python stack.py 
9.0 6.0 6.0
4.0 11.0 8.0
12.0 11.0 13.0

Answer 2

http://docs.scipy.org/doc/numpy/reference/generated/numpy.loadtxt.html 加载到numpy数组然后求和数组。

Answer 3

In [1]: import numpy as np

In [2]: from StringIO import StringIO

In [3]: txt ="""2 3 4
   ...: 1 5 6
   ...: 5 4 7"""

In [4]: f = StringIO(txt)

In [5]: arr = np.loadtxt(f,dtype = int)

In [6]: np.sum(arr,axis = 0)
Out[6]: array([ 8, 12, 17])

汇总多个文件中的列值

3 个答案: