QRCode中的Unicode编码和解码问题

时间:2009-10-23 08:23:13

标签: unicode encoding character-encoding decoding qr-code

我正在尝试生成UTF-8 QRCode,以便我可以加载重音和Unicode字符。

为了测试它,我使用了许多解码解决方案:

  1. http://zxing.org/w/decode.jspx - zxing项目也在Android中使用
  2. http://www.drhu.org/QRCode/QRDecoder.php - PHP解码器
  3. http://zbar.sf.net - ZBar条形码阅读器 - 嵌入式
  4. 的OpenSource和C项目

    所有这些都给了我相同的结果。

    您可以尝试使用this image works well with Unicode字符。

    但如果我尝试使用zxing或Google Chart API生成QRCode,我无法正确解码。

    我试过这个:

    1. http://chart.apis.google.com/chart?cht=qr&chs=200x200&choe=SHIFT_JIS&chl=R%C3%A9my+Hubscher
    2. http://chart.apis.google.com/chart?cht=qr&chs=200x200&choe=ISO-8859-1&chl=R%C3%A9my+Hubscher
    3. http://chart.apis.google.com/chart?cht=qr&chs=200x200&choe=UTF-8&chl=R%C3%A9my+Hubscher
    4. 但都没有成功。

      你知道我该怎么做吗?你知道哪个编码用于工作图像吗?

2 个答案:

答案 0 :(得分:10)

出现的解决方案是以UTF-8编码文本并添加BOM以指定字符串实际上是UTF-8。

这里有效:

答案 1 :(得分:2)

QR解码器使用的启发式方法通常会失败,BOM无法解决问题

即使通过ECI扩展名在QR码中明确指定了字符编码,大多数QR解码器也使用启发式方法自动检测字符编码。

事实证明BOM有助于您的解码器。但是对于大多数解码器而言,BOM没有帮助。作为无法显示正确的UTF-8字符串的解码器的示例,请使用带有MIUI Global v11.0.3的小米手机(及其本地扫描仪应用程序)。此电话无法正确显示您原始问题中产生的链接的UTF-8 QR码。它显示如下: R閙y Hubscher。使用BOM(使用您后续消息中的链接)时,它显示为:?R閙y Hubscher(它只是将BOM表字符显示为?)。但是,如果您在字符串之前添加像日这样的中文字符而不是BOM,则小米将正确显示该字符串。这是链接:chart.apis.google.com/chart?cht=qr&chs=200x200&choe=UTF-8&chl=%E6%97%A5R%C3%A9my%20Hubscher 小米会正确显示此链接生成的QR码中的字符串日Rémy Hubscher

另一个示例是TWMobile的“ QR码阅读器和QR码扫描仪” Android应用。它确实正确解码了您提供的所有链接中的所有QR码。因此,您不必使用BOM来使TWMobile的扫描仪正确显示字符串。

为什么QR解码器总是使用启发式来检测字符集,即使这些启发式经常失败(如您的案例所示)?如您所知,在QR码中存储文本有4种模式:(1)数字,(2)字母数字,(3)8位和(4)汉字。因此,QR代码标准本身并不支持UTF-8。要在8位字符串中使用UTF-8编码(而不是默认的“ ISO-8859-1”或“ JIS8”),实现必须在该字符串之前插入ECI(扩展通道解释)。 ECI是QR码的可选附加功能。好的一点是,它至少在2000年就已在最早的QR代码标准中定义。ECI允许使用默认字符以外的字符集进行数据编码。它还可以对其他数据解释(例如使用定义的压缩方案的压缩数据)或其他特定于行业的要求进行编码。 ECI协议是由 AIM,Inc 开发的规范中定义的,它不是免费提供的,但可以付费购买。不幸的是,即使将默认编码更改为UTF-8这样的基本操作,并非所有QR解码器都能处理ECI协议。即使对于默认编码,例如“ ISO-8859-1”(对于8位字符串模式)或“ Shift_JIS”(对于汉字模式),解码器仍会使用启发式方法来确定字符集,因为某些编码QR码的应用可能不会支持ECI或指定不正确的字符集。

结论

由于启发式自动检测字符集,QR解码器经常无法正确显示字符串,即使通过ECI明确指定了正确的编码(如您的情况),而BOM字符也无济于事,如小米示例所示。您在答复中找到了解决方案,但对小米没有帮助。一些QR解码器使用的启发式算法非常笨拙,甚至BOM也无济于事。

尽管BOM确实对您的QR解码器有所帮助,但更好的解决方案是即使使用ECI明确指定了字符编码,也应停止使用使用启发式方法的容易出错的QR解码器。

如果没有BOM的解码器无法正确解码文本,则寻找更好的QR解码器。您提供的编码器(使用链接)可以。