熊猫:如何发现字符的编码

时间:2016-05-10 19:59:47

标签: python encoding utf-8

我试图以这种方式将Pandas列中的所有字符转换为字符串:

df_sample1['county'] = df_sample1['county'].astype(str)

在执行此操作时,我遇到以下错误:

  

UnicodeEncodeError:'ascii'编解码器无法对字符u'\ xc9'进行编码   第38位:序数不在范围内(128)

Stackoverflow上讨论过类似的问题,建议的解决方案包括“你必须在源头发现这个字符的编码。”

我不知道我的列的编码是什么 - 我只期望ASCII字符,因为它们是县名。有没有办法找出哪些字符是逃学字符,如果是,我可以将它们全部转换为UTF-8吗?或者一般来说,我如何找出字符的编码是什么?

0 个答案:

没有答案