下面是我从图片中获得的示例文本:
Certificate No. Certificate Issued Date Acoount Reference Unique Doc. Reference IN-KA047969602415880 18-Feb-2016 01:39 PM NONACC(FI)/kakfscI08/BTM LAYOUT/KA-BA SUBIN-KAKAKSFCL0858710154264833O
如何从中提取证书编号?任何提示或解决方案都会在这里为我提供帮助。
答案 0 :(得分:1)
如果证书编号始终位于此处给出的结构中(2个字母,连字符,17位数字),则可以使用regex
:
import regex as re
# i took the entire sequence originally but this is just an example
sequence = 'Reference IN-KA047969602415880 18-Feb-2016 01:39'
re.search('[A-Z]{2}-.{17}', seq).group()
#'IN-KA047969602415880'
.search
搜索您指定的特定模式,然后.group()
返回第一个结果(在这种情况下将只有一个)。您可以在给定的字符串中搜索类似的内容,建议您参考regex
here。
答案 1 :(得分:1)