手写文档的分词

时间:2019-03-21 14:33:36

标签: python opencv

我正在从事DIAR的项目。

我必须对圣经的扫描页进行分词(下图)。

Scanned page of Bible

过程是:

  1. 二值化;
  2. 旋转
  3. 线段
  4. 列细分
  5. 分词

一切正常,直到第4点。

Line Segment

我们如何从线段中提取每个单词?目的是仅将行分割成单词,而不识别所写的内容。

0 个答案:

没有答案