我正在尝试从网站上提取数据 http://maps.jocogov.org/ims/
在这个网站上有一个搜索选项,在该搜索选项中我想获得与DP14000001 0001等特定属性相对应的信息
当我们搜索属性ID时,会出现一个弹出窗口,在该窗口中,我需要从此链接中提取数据“Tax Bill Info Click Here”
我将属性存储在文本文件中,以便id可以从那里迭代并在搜索选项中使用,并在弹出窗口中从链接获取数据。
我是网络抓取的新手,并编写了一些起始代码......
import re
import urllib
propertyids = "/home/NewYork/PropertyId.txt"
url = "http://maps.jocogov.org/ims/"
htmlfile = urllib.urlopen(url)
htmltext = htmlfile.read()
regex = 'class="ui-autocomplete-input" type="+propertyids+"'
pattern = re.compile(regex)
locationidinfo = re.findall(pattern,htmltext)
print locationidinfo
执行此代码后,得到的结果如此[],不知道它意味着什么。所以我迷失了设置更多代码以从网站获取数据......
任何人都可以协助继续前进吗?
提前感谢!! :)