如何创建非UTF8字符串?

时间:2014-01-12 01:28:06

标签: python

我需要测试我的代码也适用于非UTF8字符串。如何在Python中创建非UTF8字符串?

str = ?

3 个答案:

答案 0 :(得分:3)

指定不是有效UTF-8序列的字节序列,或编码为不是UTF-8的字符集。

s1 = 'AB\xfc'
s2 = u'æ'.encode('cp1252')

答案 1 :(得分:1)

您可以使用u"String"创建一个unicode字符串,然后使用utf-8以外的任何编解码器进行编码。

如果您要直接在源文件中使用unicode字符,那么您必须明确提及所使用的编码,作为此类程序的第一行。

# -*- coding: iso-8859-15 -*-
var = u"தமிழ்".encode("iso-8859-15")
print(var)

答案 2 :(得分:0)

如果你在谈论python 2(你还没有指定),那么默认编码是ascii。 所以你可以写

str = "something"

而不是unicode字符串

str = u"unicode string"