标签: pdf unicode utf-8 fonts
我正在尝试从报纸上复制文章。 以下是pdf格式文本的示例屏幕截图
当我从报纸的pdf格式复制它,并将其粘贴到microsoft word或excel上时,它会给出以下字符:
·Æ°·C≥
我相信字体是 shree bangala font 。 (不是100%肯定)
我看过其他字体,例如 Nirmala字体,在使用utf-8编码时我没有遇到任何问题。
如果有人可以指导我如何转换上述文本,将会非常有帮助。