我有一个奇怪的问题。我从Google云端视觉获取包含非英文字符的文本,但它们实际上是英文字符。这是Google云视觉OCR的错误。
我正在得到一个这样的角色:3*sizeof(int)
int *b;
我想转换为Héllo
,以便我可以处理这个单词。
我不是在寻找编程答案。我只是在寻找实现此目的的方法。
任何提示都会有用。
谢谢!
答案 0 :(得分:0)
如果您可以选择使用Apache Commons,则可以使用其StringUtils库。 stripAccents
方法应适合您的需求。从源代码中,您可以看到它实际上利用了java.text.Normalizer
,因此您也可以对此进行研究。