我已使用pdfminer
阅读了pdf文件。我想检测pdf的页眉和页脚。请让我知道是否有可能。
答案 0 :(得分:1)
Apache Tika也可以:
import tika
from tika import parser
FileName = "PDF File Name"
PDF_Parse = parser.from_file(FileName)
print(PDF_Parse ['content'])
print(PDF_Parse ['metadata']) # Format-Dictionary