来自tabule的read_pdf错误,用于读取pdf文件..?

时间:2017-12-30 05:09:39

标签: python tabula

我使用tabula包进行pdf阅读,但在这里我收到了这些错误

df = tabula.read_pdf("/tmp/university_exam_results.pdf", output_format="json", pages="all")
AttributeError: 'module' object has no attribute 'read_pdf'

我能为此错误做些什么。请修复我的问题..

1 个答案:

答案 0 :(得分:0)

对于Python2,我认为您正在搜索

pip2 install tabula-py

作为一个例子,

>>> import tabula
>>> df2 = tabula.read_pdf("https://github.com/tabulapdf/tabula-java/raw/master/src/test/resources/technology/tabula/arabic.pdf")
>>> df2
                         مرحباً                 اسمي سلطان
0  انا من ولاية كارولينا الشمال                من اين انت؟
1                          1234                عندي 47 قطط
2                  هل انت شباك؟  اسمي Jeremy في الانجليزية
3      Jeremy is جرمي in Arabic                        NaN