用于测试Unicode相关问题的Unicode示例文本文件?

时间:2013-05-13 10:28:09

标签: unicode utf-8 character-encoding normalization unicode-normalization

我正在寻找一个示例文本unicode文件(UTF-8),可用于测试与文本编码和解码相关的不同问题,包括:

  • 低ascii字符用法,如前32个代码
  • BMP以外的字符
  • NFC相关问题
  • XML编码/解码问题

主要是我想将文本复制到剪贴板中,将其粘贴到应用程序的HTML文本区域中,然后能够从页面中检索它。

这将能够识别在解码,编码甚至数据库级别可能发生的不同Unicode相关问题。

1 个答案:

答案 0 :(得分:8)

此页面用于测试网络浏览器,文档包含多个脚本:http://www.columbia.edu/~fdc/utf8/index.html

“我可以吃玻璃杯”的哥特式入口特别是在BMP之外:̈,。

规范化表单和XML处理在移动数据时通常没有问题,因此没有特别的例子可以测试这两者。