我正在尝试使用python 3.x中的pdfminer
从pdf中提取文本。我使用以下命令安装了它
pip3 install pdfminer.six
当我尝试使用以下命令提取文本时,我收到错误
pdf2txt.py sample.pdf
错误:pdf2txt.py:找不到命令
我已经阅读了他们展示的相同步骤的官方文档,但我仍然无法正常工作。
答案 0 :(得分:3)
official documentation假设.py
脚本可以自动运行。但对于所有操作系统而言并非如此(如果可能的话,您的本地系统不需要设置以使其正常工作)。
要从命令行手动启动PDFminer
,请使用启动Python脚本的常规方法:
python pdf2txt.py sample.pdf
它将运行脚本并在完成后退回到命令行。如果您因某种原因在某处遇到错误或想要留在Python中,可以使用
python -i pdf2txt.py sample.pdf
答案 1 :(得分:0)
已经很晚了,但如果仍然可以帮助您,请在终端中执行以下操作:
1。)在终端中键入ls,它将返回文件列表。检查该列表中是否存在pdf2text.py,并且sample.pdf也应该存在。
2。)如果列表中未显示这2个文件,则意味着您位于其他目录中,因此您必须导航到同时存在这两个文件的正确目录,否则您将不得不给出文件名及其路径。
3。)并给出命令:python pdf2text.py sample.pdf
4。)如果参数解析器不需要标识符,它应该可以工作。
5。)如果您有任何疑问,请随时与我联系。
干杯。