我想/需要一个测试用例来测试/打破UTF-32和UTF-16之间的转换。
对于UTF-8和UTF-16,我通常使用' Chinese Bone' test:0xE9 0xAA 0xA8(UTF8)和0x9AA8(UTF16)。
有没有人有一个负面的测试用例,应该打破UTF-16和UTF-32写得不好的实现?理想情况下,测试需要使用至少两个UTF-32值。
杰夫
答案 0 :(得分:1)
不确定你的意思,这里有一些:
UTF-16
\xD8\x00\x00\x00
或\xD8\x00\xDB\xFF
\x00\x61\xDC\00
\xDF\xFF\xDB\xFF
\xD8\x01<EOF>
'\xD8\x00\xDC'.decode('utf-16be')
UTF-32
value < 0
,value > 0x10FFFF
或0xD800 <= value && value <= 0xDFFF