处理包含双字母字符“

时间:2018-11-08 13:21:55

标签: java frequency-analysis alphabet

您将如何对待/存储Java代码中的字母“ CH”以进行频率分析?我还没有找到可与双字母“ CH”一起使用的字母库。存储在char中不再是一种选择。所有的文本处理算法都只是一一扫描。但是现在我将需要某种方式进行扫描以匹配该对。 unicode中也没有“ CH”字符,是否还有其他可以在其中找到“ CH”的编码表?

另一种方法是在输入数据文件中将“ CH”替换为“ 1”,并将“ 1”视为另一个常规字符。通过该方法,我将放弃ASCII码aritmetics的选项(因为ASCII中缺少“ ch”,所以'a'-'t'是无用的)

0 个答案:

没有答案