查找包含所有语言的char的测试字符串

时间:2016-07-15 19:48:46

标签: testing internationalization

对于I18n测试,我正在寻找一个能够很好地代表所有常用语言的测试字符串(由UTF-8支持),并且具有这些语言的所有特殊字符,这些字符通常在显示中存在问题。

将使用此测试字符串来确保我们的系统正确处理这些语言并使用能够正确显示所有这些语言的正确字体。

E.g。示例文本应该包含拉丁语,远东语言,从右到左语言的字符......

1 个答案:

答案 0 :(得分:0)

你的问题没有明确的答案,因为它含有模棱两可的术语,例如“常用语言”或“通常有显示问题”。这高度依赖于操作系统,操作系统版本,用于显示文本的文本引擎,安装的字体。几乎整个技术堆栈。

在问题中洒上“所有”(所有特殊字符,所有......语言)使任何答案都无用。 你会看到成千上万的字符串。然后你有很多组合标记和连字。你想检查所有这些组合吗?那些也可能有“显示问题”

如果您只想检查您的应用程序是否以(大多数)语言运行,请尝试从每个Unicode块中获取一些(不是全部)字符。可能还想避免使用常见字体所涵盖的历史剧本(即楔形文字,埃及象形文字等)。

通常,如果应用程序没有以某种方式破坏字符串,它将正确呈现。如果没有,那么它不是你的应用程序有错,它是底层技术的一些限制(即Windows控制台)

如果你解释你想要做什么,你可能会得到更好的答案。 或者您可以搜索国际化测试。