熊猫的数据框无法显示csv文件中的非英文字母

时间:2019-12-06 23:11:43

标签: python pandas csv utf

我有一个CSV文件,其中包含一些拉丁信息。但是,当我将其保存在数据框中时,它不会显示拉丁字母。

import pandas as pd
df = pd.read_csv('data.csv', sep=",", header=None, encoding="utf-16")

“ CSV”文件的某些行如下:

NAME, X, Y
Peñuelas,18.026618,PR
Quebradillas,18.466357,PR
Rincón,18.340562,PR

和df中显示的是?而不是那些拉丁字母。

Pe?uelas,18.026618,PR
Quebradillas,18.466357,PR
Rinc?n,18.340562,PR

我使用了 encoding =“ utf-16” encoding =“ utf-8” encoding =“ latin-1” 他们没用。

当我从数据框的NAME列中打印一个值时,它将显示以下内容:

df['NAME'][20]
Out[253]: 'San Sebasti\xc3\xa1n'

哪个应该是圣塞瓦斯蒂安

现在我该怎么做才能正确显示这些非英语?

abbr['NAME'][3208] == 'San Sebasti?n'给出 True 'San Sebasti\xc3\xa1n' == 'San Sebasti?n'返回 False 。我不明白为什么前一个是真实的。

0 个答案:

没有答案