是否可以从图像元素中删除文本,如图所示:
我做了其他一切,但
Salzufer 16
10587 Berlin
是图像的形状吗?
我使用Selenium webdriver并需要抓取地址,联系方式,经济活动分支等数据。
答案 0 :(得分:0)
似乎您要查找的文本嵌入在textRender.aspx文件的“text”参数中。您可以考虑对其进行逆向工程。
否则,对于更通用的OCR,您可以使用Google Vision API https://cloud.google.com/vision/
答案 1 :(得分:0)
如果您检查html(搜索地址),您会看到该地址实际显示在javascript代码中,生成谷歌地图。
您可以使用正则表达式来利用它。
假设您已经编码了执行搜索的部分,现在只需要提取地址。您的selenium对象被命名为驱动程序。那就是这样的:
import re
page_source = driver.page_source
add_pattern = '{address: \"(.*?)\"}'
address = re.search(page_source, add_pattern).group(1)
print(address)