标签: unicode lua word cjk
有太多组合的半角,全角,片假名,平假名,汉字,并使用替代字符(例如そ而不是ん)。
Python有一个名为jcconv的软件包可以帮助我做我需要做的事情。我想将字符串转换为标准格式,以便我可以查看受限制的单词列表。
Lua可以吗?
答案 0 :(得分:0)
为了能够在平假名,片假名和半宽片假名之间转换字符串,您可以将相应的字母字符存储在不同的表中,并在它们之间添加映射(通过索引或按键)。
这也是jcconv这样做的方式,根据来源(link)判断。
例如,如果您想将平假名转换为片假名,您可以这样做:
[hiragana] = katakana