我有一个使用DataContractSerializer
的{{1}}。默认情况下,此编码为UTF8。我在这里使用DICOM数据。我从DICOM文件序列化一些头属性。患者姓名为日文字符。
如果属性XMLWriter
SpecialCharacterSet
中输入数据的编码设置为ISO IR 100,那么我的序列化程序会抛出异常。但是,如果我使用ISO 2022 IR 87创建输入数据,则会将数据序列化。
我想知道ISO 2022 IR是否是UTF8的子集而ISO IR 100是不是?
我应该盲目地使用(0008,0005)
编码创建XMLWriter
吗?
感谢您的帮助!
答案 0 :(得分:0)
根据DICOM当前标准:PS 3.5-2015c 6.1 Support of Character Repertoires。我们有:
ISO 10646-1,10646-2及其相关补充剂和 扩展名对应于Unicode版本3.2字符集。的的 ISO IR 192对应于此使用UTF-8编码 字符集。
进一步说明ISO/IEC 2022:1994
是多字节编码(绝对不是UTF-8)。