Question

我正在尝试从网站上提取数据 http://maps.jocogov.org/ims/

在这个网站上有一个搜索选项，在该搜索选项中我想获得与DP14000001 0001等特定属性相对应的信息

当我们搜索属性ID时，会出现一个弹出窗口，在该窗口中，我需要从此链接中提取数据“Tax Bill Info Click Here”

我将属性存储在文本文件中，以便id可以从那里迭代并在搜索选项中使用，并在弹出窗口中从链接获取数据。

我是网络抓取的新手，并编写了一些起始代码......

import re
import urllib

propertyids = "/home/NewYork/PropertyId.txt"

url = "http://maps.jocogov.org/ims/"
htmlfile = urllib.urlopen(url)
htmltext = htmlfile.read()
regex = 'class="ui-autocomplete-input" type="+propertyids+"'
pattern = re.compile(regex)
locationidinfo = re.findall(pattern,htmltext)

print locationidinfo

执行此代码后，得到的结果如此[]，不知道它意味着什么。所以我迷失了设置更多代码以从网站获取数据......

任何人都可以协助继续前进吗？

提前感谢!! ：）

如何使用python从搜索选项的网站上获取数据？

0 个答案: