我的csv文件存储了已编码的utf-8数据,但未解码为原始数据格式。
解码适用于单个对象,而不适用于文件对象
实际数据: 打印(数据['文本'] [100])
b'RT @MeherKhanAnsari:当我们目睹Shehzada Salim的旅程时,我们确实目睹了这个角色的许多层次\ xf0 \ x9f \ x98 \ x8d我必须说\ xe2 \ x80 \ xa6'
解码错误: print(data ['Text'] [100] .decode('utf-8'))
AttributeError跟踪(最近一次通话) 在()中 ----> 1次打印(数据['文本'] [100] .decode('utf-8'))
AttributeError:'str'对象没有属性'decode'
如果我进入一个对象,那么它支持解码
X = b'RT @MeherKhanAnsari:当我们目睹Shehzada Salim的旅程时,我们确实见证了这个角色的许多层次\ xf0 \ x9f \ x98 \ x8d我必须说\ xe2 \ x80 \ xa6'
X.decode('utf-8')
'RT @MeherKhanAnsari:当我们目睹Shehzada Salim的旅程时,我们确实见证了这个角色的很多层面,我必须说……'
解码所有数据,例如
'RT @MeherKhanAnsari:当我们目睹Shehzada Salim的旅程时,我们确实见证了这个角色的很多层面,我必须说……'