我有一个.txt
文件,其中包含一些字符串:
word_1
word_2
word_3
....
word_n
word_n-1
我想阅读它们并将它们放入列表中,以便做这样的事情:
my_words = set(['word_1',...,'word_n-1'])
这就是我的尝试:
with open('/path/of/the/.txt') as f:
lis = set([int(line.split()[0]) for line in f])
print lis
但是我收到了这个错误:
lis = set([int(line.split()[0]) for line in f])
ValueError: invalid literal for int() with base 10: '\xc3\xa9l'
更好的方法是什么?如何处理此extarnal .txt
文件的编码?
答案 0 :(得分:1)
我认为你需要这样的东西:
with open('file.txt') as f:
lis = set(line.strip() for line in f)
print lis
结果是:
set(['word_3', 'word_2', 'word_1', 'word_21', 'word_123'])