我正在使用pdfminer和python从PDF提取法语文本。问题是我看不到éàã...等重音。
例如:
在社会上的地方(ce qu'il faut faire)上,la famille qu6becoise demeure au fon ce qu'elle n'a jamai cess6 d'Etre,malgr6当然表明了反事实。法国人唐纳德·弗朗西斯·弗朗西斯的《社会与家庭关系》。
我正在使用的命令是:
pdf2txt.py -c utf-8 sample.pdf
我已经安装了CJK语言,但仍然无法正常工作。 我正在运行python 2.7.10。
关于如何正确显示字符的任何建议?