拆分文本文件python

时间:2016-02-20 16:39:25

标签: python

我正在使用语言处理器,而且我在使用单词库过滤文本方面遇到了问题 每行读起来像

00001740 00 a 01 able
00002098 00 a 01 unable
00003552 00 s 02 emergent

但我只希望它像

able
unable 
emergent

我能想到的只有

mfile = ("in.txt","r")
nfile =  ("out.txt","w")
for line in mfile:
    ln1 = mfile.readline()
    a,b,c,d,e = ln1.split(" ")
    nfile.write("%s \n" % (e))

这不起作用 做什么? 我认为问题是mfile.readline() 但我不确定

2 个答案:

答案 0 :(得分:0)

你还没有说过什么不起作用,但我会假设你的错误是AttributeError: 'str' object has no attribute 'readlines'

不管怎样,我很确定你的问题是因为你没有打开文件:

mfile = ("in.txt","r")

应该是

mfile = open("in.txt","r") 

(不要忘记事后关闭它们)。在现有情况下,您将mfile声明为两个字符串的元组。

答案 1 :(得分:-1)

这里

words = []
with open('in.txt', 'r') as infile:
     for line in infile:
          line = line.strip()
          line = line.split(' ')
          words.append(line[4])
with open('out.txt', 'w') as outfile:
     for word in words:
          outfile.write("{0}\n".format(word))