标签: python-3.x string pdf
我使用了Tika库,但它正在提取包括表内容在内的所有内容
from tika import parser raw = parser.from_file('jk.pdf') print(raw['content'])