标签: machine-learning
在书籍序言的照片上使用tess4j(OCR库)后,我从图像中获取文本。 现在,我想从该字符串中识别作者姓名,书名。我不想在数据库中搜索字符串,因为我需要效率。
例如文字是:
第一个例子: 这里的一些文字,杰克是“丛林书”的作者这里的一些文字
第二个例子:“Jungle Book”由Jack 另一个文字写成 这里
输出应为:
我不知道怎么做,你能给我一些提示吗?