标签: python xml machine-learning python-textprocessing
我正在尝试使用Python将科学PDF自动化为XML。我想知道:有没有可以从文本或PDF文档生成XML的Python库?
答案 0 :(得分:2)
您可以使用textract来阅读pdf文件, 有关详细信息:Extracting text from a PDF file using Python 一旦在变量中包含文本,就可以使用ElementTrees来编写格式正确的XML。