我正在为以UTF-8编码的XML文件编写XSD,它可能包含许多非ASCII英语的语言。
是否有可能验证只有某些语言(特别是不使用希伯来语或阿拉伯语等英语字母的语言)才会通过验证?
答案 0 :(得分:1)
您可以在模式构面中使用正则表达式来控制可能出现的字符集,例如
<xs:pattern value="\p{IsHebrew}*"/>
但我不知道你将如何在实践中利用它:大多数语言允许使用外国脚本,例如在提到外国人的名字时。
请注意区分字符集和编码。它们是完全不同的概念。像这样的模式方面表示可能出现的字符,它不会限制它们的编码方式。