标签: java encoding utf-8
我想在Java中将编码从T1更改为UTF-8。 我使用Tika阅读并解析pdf到String。然后我使用Charset类中的解码和编码方法更改ecoding。像windows-1252或UTF-8这样的常见编码没有问题,但我找不到T1编码的类。
文字示例:
Przykªady zastosowa«
我可以在此页面上正确解码此文字: http://kanjidict.stc.cx/recode.php