标签: java pdf image-processing pdfbox text-processing
我有这个项目,我需要检测文本是否在 pdf 发票中的红色区域(红色矩形)内。
所以我的第一种方法是将pdf转换为图像并获取它的像素数组,遍历数组,并检查像素是否为红色,如果有红色像素,然后是黑色或者其他一些颜色像素后跟红色像素,这意味着红色区域内有文本。
第二种方法,获取每个字符串的坐标,并以某种方式检查该区域周围是否有红色像素。
关于如何完成这项工作的任何想法?
PS:在第一种方法中,即使红色有变化,我也能够检查像素是否为红色,在第二种方法中,我能够获得每个字符串的坐标。