我有一个带有生产图纸的pdf文档。我正在尝试从工程图中提取表格,但不幸的是,我无法这样做。任何帮助将不胜感激。
我想用python来做,因为这是我熟悉的语言。因此,经过研究后,建议将Tabula作为最佳选择。我使用了Web gui,并且能够选择表区域并将表导出到csv。我希望该程序能够自动检测该表并将其转换为csv,到目前为止,我还无法做到这一点。
import tabula
df = read_pdf("example.pdf", area=(52.831,808.83,274.571,1142.184), pages=2)
tabula.convert_into("example.pdf", "output.csv", output_format="csv")
我希望结果会从下面的pdf文件中以csv文件的形式生成表格,但并非不幸。
http://www2.mae.ufl.edu/designlab/Lab%20Assignments/EML2322L%20Assembly%20Drawing%20Organization%20and%20Dimensioning.pdf(示例PDF-第5页和第12页)