因此,我使用Google Vision API检测图像中的文字。图像有一个问题和3个多项选择答案。 Google API会返回正确的文字,但我需要将问题和答案分成单独的字符串,以便我可以单独使用问题和每个答案。这对于1张图片来说并不难,但我需要程序能够将它们分开,无论问题中有多少单词(总是以'?'结尾)< / p>
因为问题总是以'?'结尾我的想法是阅读结果,并在达到'?'时停止然后从0-'?'并将其存储为像questionResult这样的东西。
那么对于答案,他们都是分开的,所以必须要分开它们?这些也需要是他们自己的字符串/变量。
显然,我对此主题并不十分了解,而且我不确定Google API结果的格式是什么,所以任何帮助都表示赞赏。任何有关格式化此帖子的帮助也表示赞赏。
这是我当前的代码
import io
import os
# Imports the Google Cloud client library
from google.cloud import vision
from google.cloud.vision import types
# Instantiates a client
vision_client = vision.Client('"MY_API_KEY.json')
# The name of the image file to annotate
file_name = os.path.join(
os.path.dirname(__file__),
'hqtest.png') # Your image path from current directory
# Loads the image into memory
with io.open(file_name, 'rb') as image_file:
content = image_file.read()
image = vision_client.image(
content=content)
# Performs label detection on the image file
texts = image.detect_text()
# Prints results
print (texts[0].description)
运行代码的结果
C:\Users\Maxwell\Desktop\vision>python test.py
Which artist is famous for
his "Blue Period"?
J. M. W. Turner
Pablo Picasso
Prince Charles
我需要的结果
questionResult = 'Which artist is famous for his "Blue Period"?'
answerOne = "J. M. W. Turner"
answerTwo = "Pablo Picasso"
answerThree = "Prince Charles"