我需要测试我的代码也适用于非UTF8字符串。如何在Python中创建非UTF8字符串?
str = ?
答案 0 :(得分:3)
指定不是有效UTF-8序列的字节序列,或编码为不是UTF-8的字符集。
s1 = 'AB\xfc'
s2 = u'æ'.encode('cp1252')
答案 1 :(得分:1)
您可以使用u"String"
创建一个unicode字符串,然后使用utf-8
以外的任何编解码器进行编码。
如果您要直接在源文件中使用unicode字符,那么您必须明确提及所使用的编码,作为此类程序的第一行。
# -*- coding: iso-8859-15 -*-
var = u"தமிழ்".encode("iso-8859-15")
print(var)
答案 2 :(得分:0)
如果你在谈论python 2(你还没有指定),那么默认编码是ascii。 所以你可以写
str = "something"
而不是unicode字符串
str = u"unicode string"