在Python Selenium中从图像中读取文本

时间:2017-07-05 12:02:19

标签: python selenium

是否可以从图像元素中删除文本,如图所示:

Picture

我做了其他一切,但

Salzufer 16
10587 Berlin

是图像的形状吗?

我使用Selenium webdriver并需要抓取地址,联系方式,经济活动分支等数据。

2 个答案:

答案 0 :(得分:0)

似乎您要查找的文本嵌入在textRender.aspx文件的“text”参数中。您可以考虑对其进行逆向工程。

否则,对于更通用的OCR,您可以使用Google Vision API https://cloud.google.com/vision/

答案 1 :(得分:0)

如果您检查html(搜索地址),您会看到该地址实际显示在javascript代码中,生成谷歌地图。

您可以使用正则表达式来利用它。

假设您已经编码了执行搜索的部分,现在只需要提取地址。您的selenium对象被命名为驱动程序。那就是这样的:

import re
page_source = driver.page_source
add_pattern = '{address: \"(.*?)\"}'
address = re.search(page_source, add_pattern).group(1)
print(address)