我该怎么做?我想迭代每个单词,看看它是否适合某些参数(例如它是否超过4个字母..但是,虽然不是很重要)。
文本文件实际上是一个带有标点符号和空格的文本,就像这个帖子一样。
答案 0 :(得分:2)
尝试split()
字符串。
f = open('your_file')
for line in f:
for word in line.split():
# do something
如果你想要它没有标点符号:
f = open('your_file')
for line in f:
for word in line.split():
word = word.strip('.,?!')
# do something
答案 1 :(得分:0)
您可以简单地content.split()
答案 2 :(得分:0)
f = open(filename,"r");
lines = f.readlines();
for i in lines:
thisline = i.split(" ");
答案 3 :(得分:0)
data=open("file").read().split()
for item in data:
if len(item)>4:
print "longer than 4: ",item