获取XML数据非unicode时的错误字体

时间:2010-12-30 05:06:27

标签: xml

我正在尝试从客户端到JSP服务器页面发布XML数据(使用encoding =“euc-kr”,非utf-8)。

XML数据的格式如下:

<?xml version="1.0" encoding="euc-kr" ?>
<book>
  <id>123456789</id>
  <name>한국어</name>
</book>

但在服务器页面上,我无法获得完全相同的字体。获得结果如下所示:

<name>Çѱ¹¾î</name>

字体错误。

我正在使用JSP(客户端和服务器也是jsp)。 我如何能够以非unicode格式获得正确的结果?

谢谢!

1 个答案:

答案 0 :(得分:0)

您的数据很好。客户将其解释为CP1252而不是EUC-KR。

>>> print u'Çѱ¹¾î'.encode('cp1252').decode('euc-kr')
한국어