我有一段写作的文本文件,想要迭代Python中的每个单词

时间:2010-10-21 06:39:27

标签: python

我该怎么做?我想迭代每个单词,看看它是否适合某些参数(例如它是否超过4个字母..但是,虽然不是很重要)。

文本文件实际上是一个带有标点符号和空格的文本,就像这个帖子一样。

4 个答案:

答案 0 :(得分:2)

尝试split()字符串。

f = open('your_file')
for line in f:
    for word in line.split():
        # do something

如果你想要它没有标点符号:

f = open('your_file')
for line in f:
    for word in line.split():
        word = word.strip('.,?!')
        # do something

答案 1 :(得分:0)

您可以简单地content.split()

答案 2 :(得分:0)


   f = open(filename,"r");
   lines = f.readlines();
   for i in lines:
   thisline = i.split(" ");

答案 3 :(得分:0)

data=open("file").read().split()
for item in data:
   if len(item)>4:
      print "longer than 4: ",item