标签: python pdf utf-8
我试图从我拥有的一些PDF中读出一些数学问题,例如:
目前我正在使用Textract的process,但它给出了如下输出:(用带有charset = utf-8的HTML文件编写)
我的问题是,是否有可能以更好的格式提取方程式,至少有一种可读或可转换为可读格式?文本会更好,但图像也可以工作。干杯!