Python - 从PDF中复制数学问题,包括公式/符号?

时间:2018-02-02 16:49:30

标签: python pdf utf-8

我试图从我拥有的一些PDF中读出一些数学问题,例如:

PDF File

目前我正在使用Textractprocess,但它给出了如下输出:(用带有charset = utf-8的HTML文件编写)

Textract Output

我的问题是,是否有可能以更好的格式提取方程式,至少有一种可读或可转换为可读格式?文本会更好,但图像也可以工作。干杯!

0 个答案:

没有答案