java - 如何用英文字符替换非英文字符 - Thinbug

如何用英文字符替换非英文字符

时间：2020-06-10 05:40:22

标签： java python php

我有一个奇怪的问题。我从Google云端视觉获取包含非英文字符的文本，但它们实际上是英文字符。这是Google云视觉OCR的错误。

我正在得到一个这样的角色：3*sizeof(int)

int *b;

我想转换为Héllo，以便我可以处理这个单词。

我不是在寻找编程答案。我只是在寻找实现此目的的方法。

任何提示都会有用。

谢谢！

1 个答案:

答案 0 :(得分：0)

如果您可以选择使用Apache Commons，则可以使用其StringUtils库。 stripAccents方法应适合您的需求。从源代码中，您可以看到它实际上利用了java.text.Normalizer，因此您也可以对此进行研究。