Camelot实际上将某些行分隔为单独的行。结果是应该属于前一行的行。
我正在与Camelot一起从银行对帐单中提取数据。问题在于,Camelot实际上将某些行视为不分开的行。 ?正如您在所附图像中看到的那样,2019年1月9日的交易实际上分成了三行。当描述超过一行(附加原始语句)时,就会发生这种情况。
我尝试优化row_tol和col_tol没有成功。 Camelot内有什么解决方案吗?如果没有,那潘达斯的快速解决方案是什么?
tables = camelot.read_pdf('BOA1.pdf',flavor='stream', flag_size=True)
tables