我正在尝试使用Tabula-py来阅读pdf。我通过pip install tabula-py
我还安装了所需的依赖项
requests
pandas
pytest
flake8
我的代码目前如下:
import tabula
import pandas as pd
df = tabula.read_pdf("report.pdf", pages=2)
print(df)
我收到以下错误:
Traceback (most recent call last):
File "tabula_pdf_reader.py", line 1, in <module>
import tabula
ImportError: No module named tabula
我在这里缺少什么输入?
答案 0 :(得分:1)
我在Ubuntu中也遇到了同样的问题。
首先,通过运行java --version
和javac --version
检查计算机上安装的JDK和JRE的版本。每个版本的版本都应大于7。
然后使用pip3
安装表格。
答案 1 :(得分:1)
在终端上执行时,我在这里遇到了同样的问题。 但是,在我以“ ipython3”而不是“ ipython”开始运行后,它运行良好。 您必须确保tabula-py模块安装在python3目录中,而不是python2
答案 2 :(得分:0)
使用此
import camelot
tables = camelot.read_pdf('foo.pdf')
tables.export('foo.csv', f='csv', compress=True)