识别名片中的全名

时间:2017-12-02 12:27:45

标签: python ocr

我的项目有问题,希望能收到你的帮助。我想从我使用OCR识别图像文本的文本中保存全名。我怎样才能做到这一点?对不起,因为我的英语不好。

1 个答案:

答案 0 :(得分:0)

从文本中删除所有数字,特殊字符,电子邮件等。你最终得到的是剩下的文字。然后,您可以尝试使用 nltk 查找专有名词(NNP)。

import nltk
nltk.pos_tag(["Tam","Nguyen"])

唯一的问题是你可能会得到误报。例如,如果Tam Nguyen跟着首席技术官,那么你也会有NNP。看看这是否有助于缩小您的问题范围。