使用PDFminer将PDF转换为html

时间:2013-07-23 21:07:58

标签: python

我正在尝试使用pdfminer命令行工具将pdf文件转换为html文件,运行后

pdf2txt.py -o output.html -t html casino.pdf

我收到以下错误:

Traceback (most recent call last):
  File "/usr/local/bin/pdf2txt.py", line 101, in <module>
    if __name__ == '__main__': sys.exit(main(sys.argv))
  File "/usr/local/bin/pdf2txt.py", line 87, in main
    layoutmode=layoutmode, laparams=laparams, outdir=outdir)
TypeError: __init__() got an unexpected keyword argument 'outdir'

之前我使用过这个库并且它工作正常,我真的很难理解发生了什么

这是图书馆http://www.unixuser.org/~euske/python/pdfminer/index.html

的链接

2 个答案:

答案 0 :(得分:2)

删除并重新安装库

后,它似乎正在工作

答案 1 :(得分:2)

在第98行的/usr/local/bin/pdf2txt.py文件中删除, debug=debug,它将起作用。我不知道为什么代码作者将这个arg插入错误的地方。