csv到pandas.DataFrame,同时保持数据原始编码

时间:2018-04-23 05:55:23

标签: python-3.x pandas python-unicode

我有一个csv文件,其中包含一些utf8个unicode字符,我希望将其加载到pandas.DataFrame中,同时保持unicode字符的原样,而不是转义它们。

输入.csv

letter,unicode_primary,unicode_alternatives
8,\u0668,"\u0668,\u06F8"

代码:

df = pd.DataFrame.from_csv("file.csv")
print(df.loc[0].unicode_primary)

结果:

> \\u0668

期望的结果:

> \u0668

> 8

1 个答案:

答案 0 :(得分:-1)

请使用read_csv而不是from_csv,如下所示。

df = pd.DataFrame(pd.read_csv("file.csv", encoding = 'utf_8'))
print(df.loc[0].unicode_primary)