如何在Python中比较不同的编码字符串

时间:2013-12-03 03:25:01

标签: python character-encoding

我需要加载两个不同的json文件并将其保存在数组中。

我将2个数组转换为set Aset B

我想在set Aset B

中找到差异

所以我尝试了setA ^ set B

但结果并不像我期望的那样。

实际上,2个数组是相同的而不考虑编码。

所以我得到了len(setA ^ set B)> 0,因为它们的编码不同。

将不同编码字符串转换为相同编码的Python方法是什么?

阵列A

"'Original'", "'Original'", "'Original'", "'Original'", "'Originale'", "u'\u30aa\u30ea\u30b8\u30ca\u30eb'", "'Original'", "u'\u539f\u59cb\u7684'", "u'\u539f\u59cb'", "u'Origin\xe1ln\xed'", "u'\u041d\u043e\u0440\u043c\u0430\u043b\u044c\u043d. \u0432\u0438\u0434'",

阵列B

"'Original'", "'Original'", "'Original'", "'Original'", "'Originale'", "'\xe3\x82\xaa\xe3\x83\xaa\xe3\x82\xb8\xe3\x83\x8a\xe3\x83\xab'", "'Original'", "'\xe5\x8e\x9f\xe5\xa7\x8b\xe7\x9a\x84'", "'\xe5\x8e\x9f\xe5\xa7\x8b'", "'Origin\xc3\xa1ln\xc3\xad'", "'\xd0\x9d\xd0\xbe\xd1\x80\xd0\xbc\xd0\xb0\xd0\xbb\xd1\x8c\xd0\xbd. \xd0\xb2\xd0\xb8\xd0\xb4'",

0 个答案:

没有答案