并非所有扩展Ascii字符都被转换为ASCII

时间:2019-07-29 15:45:28

标签: java transliteration icu4j

使用icu4j-63.1库,我们正在为项目翻译纯文本为ASCII字符。在少数情况下,音译无法按预期进行。

请让我知道我是否在这里丢失了一些东西。

以下代码用于音译

Transliterator any2Latin = Transliterator.getInstance("Any-Latin/UNGEGN; Latin; Title");
Transliterator latin2Ascii = Transliterator.getInstance("Latin-ASCII");
latin2Ascii.transliterate(any2Latin.transliterate(<<Input String>>))

下面是音译不起作用的示例文本列表,即输入和输出字符串都相同。

  • L±NFANT TRUST(预期音译为±到+/-。但是 输出与给定的字符串相同)。
  • DON¢A
  • JAIME CASTA¦ON
  • ENGºJOSE BARATA
  • TERRYSTUARDCB¬NEWTONRAY¬
  • ¥YOUNG©(此处,©已成功转换为(C),但未转换为日元 符号。音译后,日元符号保持不变)

0 个答案:

没有答案