如何使用python只读取每行文件的第一个单词?

时间:2017-04-01 21:40:49

标签: python file parsing

读取大文本文件中每行的第一个单词的最有效方法是什么?我应该使用split吗?有更有效的方法吗?我可以只阅读一个单词并丢弃该行并转到下一行吗? 现在我用这个:

for line in f:
    dct[line.split(None, 1)[0]] = dct.get(line.split(None, 1)[0], 0) + 1

4 个答案:

答案 0 :(得分:3)

为了最大限度地提高效率

line.split(" ",1)[0]

首次出现拆分因此可以节省时间

答案 1 :(得分:0)

为了确定“线”是什么,您必须阅读,直到找到换行符。如果您只想使用第一个单词,则您已正确识别出split()是可行的方法。

答案 2 :(得分:0)

只需使用somestring.split(" ")

即可

答案 3 :(得分:0)

尝试:

with open('file.txt','r') as f:
    for line in f:
        print(line.split(' ')[0])

file.txt是您要阅读的文件。您也可以使用:

f = open('file.txt', 'r') 
for line in f:
        print(line.split(' ')[0])
  • f.readline()返回
  • .split(' ')创建一个列表,其中每个单词都作为元素
  • [0]选择第0个元素

我把它放在最大化效率的同时不会浪费时间为变量赋值。虽然不算太多。