如何限制某些字符集的使用

时间:2016-05-22 23:36:37

标签: android validation

我希望这个问题不会因为没有显示一些实际的代码而被标记,但这就是这种情况的核心。我甚至不知道从哪里开始解决这个问题,即使尝试在Google上使用多个关键字组合,也就是在SO上。

我的客户突然决定我为他开发的Android应用程序的一半必须是中文,所以在我对数据库进行了一些更改后,有些字段可以采用简体中文字符集,我需要确保我的客户(住在荷兰)只使用应用程序中特定EditText字段中的那些字符。 (现在有更多的数据库字段只允许使用简体中文,但是这些值来自应用程序的下拉列表,所以我不需要担心它们的错误字符。)

那么如何确保在EditText字段中只使用简体中文?

1 个答案:

答案 0 :(得分:1)

这是Ruby中的一个项目,它试图检测字符是繁体中文,简体中文还是日文(可能是其他人?):https://github.com/jpatokal/script_detector

此检测基于Unihan Database,其中有一个名为Unihan_Variants.txt的文件。 (下载包含此文本文件here的zip文件。)

可以想象,您可以将txt文件解析为查找表,并检查unicode值,因为在EditText的onTextChanged()期间输入了文本。但是,上面链接的项目自述文件指出:"重要的是要理解这需要长段文本才能可靠地工作,因为单个字符甚至几个字符可能同时有效日语,繁体中文和简体中文"因此,在个别基础上清除角色可能会很困难。