如何用英文字符替换非英文字符

时间:2020-06-10 05:40:22

标签: java python php

我有一个奇怪的问题。我从Google云端视觉获取包含非英文字符的文本,但它们实际上是英文字符。这是Google云视觉OCR的错误。

我正在得到一个这样的角色:3*sizeof(int)

int *b;

我想转换为Héllo,以便我可以处理这个单词。

我不是在寻找编程答案。我只是在寻找实现此目的的方法。

任何提示都会有用。

谢谢!

1 个答案:

答案 0 :(得分:0)

如果您可以选择使用Apache Commons,则可以使用其StringUtils库。 stripAccents方法应适合您的需求。从源代码中,您可以看到它实际上利用了java.text.Normalizer,因此您也可以对此进行研究。