我需要一个开源解决方案来对文档进行分类。我不想使用NLP,我只需要检查外观即可。
我尝试过OpenCV。我有一个模板,我需要匹配它。
import cv2
template = cv2.imread(template_file,0)
template = cv2.normalize(template, None, alpha=0, beta=1, norm_type=cv2.NORM_MINMAX, dtype=cv2.CV_32F)
method = ['cv2.TM_CCOEFF_NORMED']
img = img2.copy()
method = eval(meth)
# Apply template Matching
res = cv2.matchTemplate(img,template,method)
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
这种方法似乎不那么健壮,而且我得到了很多误报。