从使用OCR获得的字符串中识别作者姓名,书名

时间:2016-09-27 07:48:43

标签: machine-learning

在书籍序言的照片上使用tess4j(OCR库)后,我从图像中获取文本。 现在,我想从该字符串中识别作者姓名,书名。我不想在数据库中搜索字符串,因为我需要效率。

例如文字是:

  • 第一个例子: 这里的一些文字,杰克是“丛林书”的作者这里的一些文字

  • 第二个例子:“Jungle Book”由Jack 另一个文字写成 这里

输出应为:

  • 作者:杰克
  • 书名:Jungle Book

我不知道怎么做,你能给我一些提示吗?

0 个答案:

没有答案