Python - 将字符串转换为列表

时间:2015-02-05 23:59:02

标签: python string list

我正在尝试将此字符串转换为列表:

f = open( "animals.txt", "r")
g = f.read()
g1 = g.split(",")
print g1 # list of words

我得到了:

['\x93SHEEP\x94', '\x94TIGER\x94', '\x94LION\x94', '\x94DEER\x94',
'\x94PIG\x94', '\x94DOG\x94', '\x94CAT\x94', '\x94SHARK\x94',
'\x94RAT\x94', '\x94EEL\x94']

我想要的是:

['SHEEP', 'TIGER', 'LION', 'DEER', 'PIG', 'DOG', 'CAT', 'SHARK', 'RAT', 'EEL']

我该怎么做?

3 个答案:

答案 0 :(得分:3)

您可以使用encode('ascii','ignore')删除unicodes,但请注意,首先您需要为python澄清您的字符串是unicode,您可以使用decode('unicode_escape')执行此操作:

>>> l
['\x93SHEEP\x94', '\x94TIGER\x94', '\x94LION\x94', '\x94DEER\x94', '\x94PIG\x94', '\x94DOG\x94', '\x94CAT\x94', '\x94SHARK\x94', '\x94RAT\x94', '\x94EEL\x94']
>>> [i.decode('unicode_escape').encode('ascii','ignore') for i in l]
['SHEEP', 'TIGER', 'LION', 'DEER', 'PIG', 'DOG', 'CAT', 'SHARK', 'RAT', 'EEL']

答案 1 :(得分:0)

尝试将其放在代码顶部:

#!/usr/bin/env python
# -*- coding: utf-8 -*-

答案 2 :(得分:0)

尝试使用以下语言转义字符串:

g.decode("unicode-escape")

或:

for i in range(0,len(g1)):
    g1[i] = g1[i].decode("unicode-escape")

这假设g1是包含字符串的数组,g是包含整个文件作为字符串的变量。

我得到了答案:

Python: Sanitize a string for unicode?