我试图在pydev eclipse中操作一些UTF-8文本,但它不能正确打印它们:
e.g。
['217080104288', 'Post from \xd8\xa3\xd8\xb2\xd8\xb1\xd9\x8a \xd8\xba\xd9\x84\xd8\xaa\xd9\x88\xd9\x85 ', '\xd8\xa3\xd8\xb2\xd8\xb1\xd9\x8a \xd8\xba\xd9\x84\xd8\xaa\xd9\x88\xd9\x85', 'Project Sunlight by Unilever Setelah video pendek ini selesai, anda akan diarahkan untuk menjawab survei dan menghasilkan Rp. 5000 Video mungkin tidak dapat diputar di semua browser. Kami sarankan untuk menggunakan Chrome.'
在notepad ++中显示正确:
217080104292,"Post from أزري غلتوم ","أزري غلتوم","Project Sunlight by Unilever Setelah video pendek ini selesai, anda akan diarahkan untuk menjawab survei dan menghasilkan Rp. 5000 Video mungkin tidak dapat diputar di semua browser. Kami sarankan untuk menggunakan Chrome.","facebook.com Discussions","Feb 09, 2014 04:18 AM",0,0,0,0,0,0,0,0,0,0,Neutral
偶数编码(“UTF-8”)无法正确显示。
答案 0 :(得分:1)
当您打印list
时,它会在列表的每个元素上使用repr
将其转换为字符串。 repr
旨在更加保守,它始终显示非ASCII字符的Unicode字符作为转义序列。如果您想自然地打印字符串,请单独打印,而不是尝试打印包含它的list
。