在.csv文件中导入带有特殊字符的值

时间:2017-05-05 07:51:57

标签: python python-2.7

我在.csv文件中的值看起来像这样:

drieëntachtig
één

现在我尝试使用以下命令读取相关值;

df = pd.read_csv('test.csv', sep=";")
numbers = df['numbers'].tolist()

然而,当我看到这些值时,我会在控制台中看到这一点:

drie�ntachtig
��n

有人能告诉我如何阅读python 2.7中的值,以便获得正常值吗?我已经尝试过了:

df = pd.read_csv('test.csv', sep=";", encoding= "uft8")

1 个答案:

答案 0 :(得分:1)

当您阅读pandas中的csv文件时,可以encoding latin,请参阅standard-encodings

df = pd.read_csv('character.csv', sep=";", encoding='latin')

假设您有character.csv中的内容:

test
drieëntachtig
één
banana
orange
apple

然后你打印df,它会给你:

        test
0   drieëntachtig
1   één
2   banana
3   orange
4   apple