我在JavaScript的一个函数中实现了case折叠。我在CaseFolding.txt文件中生成了所需的JavaScript代码。
U_FOLD_CASE_DEFAULT
的文档说ICU将使用:
CaseFolding.txt中定义的默认映射。
我想确认使用C
和F
类型是默认选项。我知道根据文档排除了T
。
一个。要进行简单的大小写折叠,请使用状态为C + S的映射。
B中。要进行完整的案例折叠,请使用状态为C + F的映射。
根据所需的案例折叠,可以使用或省略具有状态T的映射 行为。 (默认选项是排除它们。)
我是否从CaseFolding.txt
中选择了正确的值?
答案 0 :(得分:1)
这取决于是否可以访问缓冲区:U_FOLD_CASE_DEFAULT
在使用C
中的字符函数时引用S
+ uchar.h
映射(如{{3}在C
中使用字符串函数(例如u_foldCase()
)时,以及F
+ ustring.h
映射。
通常,您应该尽可能使用C
+ F
映射(例如,您不需要1:1映射)。
答案 1 :(得分:0)
是的,这是默认值。根据当前Unicode标准(8.0.0)的3.13节(PDF),默认情况下折叠:
...使用状态字段值为“C”或“F”的映射 Unicode字符数据库中的数据文件CaseFolding.txt。