从非常混乱的文本文件创建逗号分隔文件

时间:2012-07-04 06:20:54

标签: python-3.x

我正在尝试从非常混乱的文本文件创建逗号分隔文件。我已经看过这里发布的一些可能相关的问题,但到目前为止还没有任何工作。

这是文件的一小部分:

1 1

E 1 1

2 2

1

2

E 2 2

3 3

   7        C1

E 3 3

4 4

   7        C1

E 4 4

5 5

3

E 5 5

6 6

E 6 6

7 7

E 7 7

8 8

3

E 8 8

9 9

E 9 9

10 10

E 10 10

任何建议都会非常感激。非常感谢提前。

1 个答案:

答案 0 :(得分:0)

您是否尝试同时在线级和“块”级别工作?

str.split()默认处理空格和制表符:

lines = open('infile.txt').readlines()
# split each line based on tabs and spaces
lines = [ x.split() for x in lines ]
# remove empty fields (assuming you want to)
lines = [ x for x in lines if len(x) > 0 ]
# transform your lists (lines) into coma separated strings
lines = [ ','.join(x) for x in lines ]
# separate lines with \n for writelines
lines = [ x + '\n' for x in lines ]
open('outfile.txt', 'w').writelines(lines)

当然,你可以将这些列表理解中的一些结合起来,为了清楚起见,我将它们分开。