Camelot对待相同单元格的不同行

时间:2019-04-05 21:33:20

标签: pandas pdf text-mining python-camelot

Camelot实际上将某些行分隔为单独的行。结果是应该属于前一行的行。

我正在与Camelot一起从银行对帐单中提取数据。问题在于,Camelot实际上将某些行视为不分开的行。 ?正如您在所附图像中看到的那样,2019年1月9日的交易实际上分成了三行。当描述超过一行(附加原始语句)时,就会发生这种情况。

我尝试优化row_tol和col_tol没有成功。 Camelot内有什么解决方案吗?如果没有,那潘达斯的快速解决方案是什么?

tables = camelot.read_pdf('BOA1.pdf',flavor='stream', flag_size=True)
tables

enter image description here

enter image description here

0 个答案:

没有答案