我试图从网页中获取代理
import urllib
import re
myfile = open("C:\\Users\Teli\Desktop\pro.txt", "w")
page = urllib.urlopen("http://www.samair.ru/proxy/ip-address-01.htm").read()
a = re.findall('\d+\.\d+\.\d+\.\d+', page)
myfile.write(str(a))
myfile.close()
为什么这么说:
page = urllib.urlopen("http://www.samair.ru/proxy/ip-address-01.htm").read()
AttributeError: 'module' object has no attribute 'urlopen'
答案 0 :(得分:0)
您要么使用python 3,要么在当前目录中有一个名为urllib.py
的文件。
答案 1 :(得分:0)
我使用了python2.7并且它有效
import urllib
import re
myfile = open("C:\\Users\Teli\Desktop\pro.txt", "w")
pagea = urllib.urlopen("http://www.samair.ru/proxy/ip-address-01.htm").read()
a = re.findall('\d+\.\d+\.\d+\.\d+', pagea)
pageb = urllib.urlopen("http://www.samair.ru/proxy/ip-address-02.htm").read()
b = re.findall('\d+\.\d+\.\d+\.\d+', pageb)
pagec = urllib.urlopen("http://www.samair.ru/proxy/ip-address-03.htm").read()
c = re.findall('\d+\.\d+\.\d+\.\d+', pagec)
paged = urllib.urlopen("http://www.samair.ru/proxy/ip-address-04.htm").read()
d = re.findall('\d+\.\d+\.\d+\.\d+', paged)
myfile.write(str(a)) myfile.write(str(b)) myfile.write(str(c))
myfile.write(str(d)) myfile.close()