将“字符集范围”标准化为国际定义的值

时间:2011-05-04 10:05:12

标签: character-encoding character ansi iso

假设我有一个接受A-Z,a-z,0-9的字段。如果我正在尝试与某人沟通,通过文档或api创建“我的代码可以接受什么”,我必须说:

A-Z,a-z,0-9

现在我认为这是限制性的,容易出错。

将其与我提出的建议进行比较。

假设A-Z,a-z,0-9被分配了“代码”ANSI456

当我与某人沟通时,我可以说我的代码接受ANSI456。如果其他人正在开发支票,那么我的代码可以或不能接受的内容就不会混淆。

对于那些建议只指定字符范围的人,请注意我想象的将会处理甚至将其定义为有效“代码”的情况

0-9, +, -, *, /

事实上,如果它正确完成,我们可以使用各种语言的网站生成自动代码来容纳不同的“代码”。

好的 - 我知道有无限的值,例如:

a-z      

不同
a-l,n-z

这些“系统”中有两个不同的代码。

我不是在提出一个人工审核系统 - 它可以是完全自动的但是系统地生成这些“代码”

1 个答案:

答案 0 :(得分:0)

虽然它的名字中没有“标准”一词,但已经有了这样的标准。它被称为 Perl 5兼容的正则表达式,它用于Perl 5,Java,JavaScript,libpcre和许多其他上下文。