我使用tabula-py使用python代码来读取PDF以提取文本,然后通过tabula-py将其更改为表格形式。但它给了我一个警告。
Nov 15, 2017 3:40:23 PM org.apache.pdfbox.pdmodel.font.PDSimpleFont toUnicode
WARNING: No Unicode mapping for .notdef (9) in font Helvetica
此警告属于tabula-py,而Tabula-py是用Java编写的。所以我不能简单地使用-W ignore
来抑制上述警告。
有没有办法删除或取消上述警告。
答案 0 :(得分:6)
tabula-py作者在这里。设置cd
将禁止制表Java日志。
也可以看看:
https://github.com/chezou/tabula-py/blob/e11d6f0ac518810b6d92b60a815e34f32f6bf085/tabula/io.py#L65
https://tabula-py.readthedocs.io/en/latest/tabula.html#tabula.io.build_options
答案 1 :(得分:2)
尝试一下可能会有所帮助:
import warnings
warnings.filterwarnings('ignore')
答案 2 :(得分:1)
Tabula提供了一个内置功能来抑制Java警告。
在请求中尝试silent=True
参数:
tabula.read_pdf("/path/to/sample.pdf", pages="all", silent=True)