基本上,我有一个巨大的文件,所有文件包含每行多个单词,每个单词用空格分隔。有点像这样:
WORD WORD WORD WORD
ANOTHER
WORD SCRABBLE BLAH
YES NO
我想要做的是将文件中的所有单词放入一个巨大的列表中,我尝试使用拆分但不考虑新行(\ n)
答案 0 :(得分:3)
通过新行上的for line in f
分割进行阅读,并且它在内存方面有效(它一次读取一行),但是将所有内容放在一个巨大的列表中却不是。无论如何,如果你坚持:
huge_list = []
with open(huge_file, "r") as f:
for line in f:
huge_list.extend(line.split())
要将整个文件作为字符串读入内存,请改用f.read()
:
huge_list = []
with open(huge_file, "r") as f:
huge_list = f.read().split()
输入文件(由空格和换行符分隔的单词):
WORD WORD WORD WORD
ANOTHER
WORD SCRABBLE BLAH
YES NO
两个例子的输出:
>>> huge_list
['WORD', 'WORD', 'WORD', 'WORD', 'ANOTHER', 'WORD', 'SCRABBLE', 'BLAH', 'YES', 'NO']
>>>