如何将非英文字符转换为Unicode(UTF-8)

时间:2017-12-22 16:36:03

标签: pdf unicode utf-8 fonts

我正在尝试从报纸上复制文章。 以下是pdf格式文本的示例屏幕截图

Bengali text

当我从报纸的pdf格式复制它,并将其粘贴到microsoft word或excel上时,它会给出以下字符:

·Æ°·C≥

我相信字体是 shree bangala font 。 (不是100%肯定)

我看过其他字体,例如 Nirmala字体,在使用utf-8编码时我没有遇到任何问题。

如果有人可以指导我如何转换上述文本,将会非常有帮助。

0 个答案:

没有答案