Python pdfminer无法正确显示utf-8字符

时间:2018-09-26 13:30:07

标签: python utf-8 pdfminer

我正在使用pdfminer和python从PDF提取法语文本。问题是我看不到éàã...等重音。

例如:

在社会上的地方(ce qu'il faut faire)上,la famille qu6becoise demeure au fon ce qu'elle n'a jamai cess6 d'Etre,malgr6当然表明了反事实。法国人唐纳德·弗朗西斯·弗朗西斯的《社会与家庭关系》。

我正在使用的命令是:

pdf2txt.py -c utf-8 sample.pdf

我已经安装了CJK语言,但仍然无法正常工作。 我正在运行python 2.7.10。

关于如何正确显示字符的任何建议?

0 个答案:

没有答案