标签: python pdf checkbox
我有一个需要解析的PDF文件。该文件包含复选框。我需要知道在解析PDF之后检查哪个框以及哪个框未选中。
我主要使用Python,所以我在Python中尝试了pdfminer/pdf2txt包。使用该包,我能够将PDF转换为HTML,其中包含相同的复选框,但我无法看到选中哪个复选框,以及在将文件转换为HTML后不是。 有没有人曾经做过这种类型的操作或有任何想法如何做到这一点? 以下是我想要转换为HTML /文本或任何其他适合解析的格式的示例。
pdfminer/pdf2txt