读取大文本文件中每行的第一个单词的最有效方法是什么?我应该使用split
吗?有更有效的方法吗?我可以只阅读一个单词并丢弃该行并转到下一行吗?
现在我用这个:
for line in f:
dct[line.split(None, 1)[0]] = dct.get(line.split(None, 1)[0], 0) + 1
答案 0 :(得分:3)
为了最大限度地提高效率
line.split(" ",1)[0]
首次出现拆分因此可以节省时间
答案 1 :(得分:0)
为了确定“线”是什么,您必须阅读,直到找到换行符。如果您只想使用第一个单词,则您已正确识别出split()
是可行的方法。
答案 2 :(得分:0)
只需使用somestring.split(" ")
答案 3 :(得分:0)
尝试:
with open('file.txt','r') as f:
for line in f:
print(line.split(' ')[0])
file.txt
是您要阅读的文件。您也可以使用:
f = open('file.txt', 'r')
for line in f:
print(line.split(' ')[0])
f.readline()
返回.split(' ')
创建一个列表,其中每个单词都作为元素[0]
选择第0个元素我把它放在最大化效率的同时不会浪费时间为变量赋值。虽然不算太多。