标签: python pdf text
我要解析数百个pdf页面。它们都以相似的方式约占95%。我不想先将它们转换为文本文件,因为由于python模块转换格式的效率低下,它会导致数据不一致。有什么办法可以在Python中做到吗?