从python3

时间:2019-01-26 21:42:47

标签: python-unicode

我的csv文件存储了已编码的utf-8数据,但未解码为原始数据格式。

解码适用于单个对象,而不适用于文件对象

实际数据: 打印(数据['文本'] [100])

b'RT @MeherKhanAnsari:当我们目睹Shehzada Salim的旅程时,我们确实目睹了这个角色的许多层次\ xf0 \ x9f \ x98 \ x8d我必须说\ xe2 \ x80 \ xa6'

解码错误: print(data ['Text'] [100] .decode('utf-8'))

AttributeError跟踪(最近一次通话)  在()中 ----> 1次打印(数据['文本'] [100] .decode('utf-8'))

AttributeError:'str'对象没有属性'decode'

如果我进入一个对象,那么它支持解码

X = b'RT @MeherKhanAnsari:当我们目睹Shehzada Salim的旅程时,我们确实见证了这个角色的许多层次\ xf0 \ x9f \ x98 \ x8d我必须说\ xe2 \ x80 \ xa6'

X.decode('utf-8')

'RT @MeherKhanAnsari:当我们目睹Shehzada Salim的旅程时,我们确实见证了这个角色的很多层面,我必须说……'

解码所有数据,例如

'RT @MeherKhanAnsari:当我们目睹Shehzada Salim的旅程时,我们确实见证了这个角色的很多层面,我必须说……'

0 个答案:

没有答案