因此,当我拥有此代码时,它可以完美运行:
import requests
import re
def clean(toclean):
m = re.findall("'(.*?)\'", str(toclean))
rdy = ''.join([item.rstrip('\n') for item in m])
return pretty(rdy)
def pretty(pret):
m = re.findall('UA-[0-9]+-[0-9]+', str(pret))
rdy = ''.join([item.rstrip('\n') for item in m])
return rdy
r = requests.get('http://editinginsider.com')
m = re.findall('UA-[0-9]+-[0-9]+', r.text)
print clean(m)
但是,当我尝试逐行迭代文本文件中的列表时,我得到此名称或服务不知道错误
import requests
import re
def clean(toclean):
m = re.findall("'(.*?)\'", str(toclean))
rdy = ''.join([item.rstrip('\n') for item in m])
return pretty(rdy)
def pretty(pret):
m = re.findall('UA-[0-9]+-[0-9]+', str(pret))
rdy = ''.join([item.rstrip('\n') for item in m])
return rdy
f = open( "domains.txt", "r" )
for line in f:
r = requests.get(line, timeout=7)
m = re.findall('UA-[0-9]+-[0-9]+', r.text)
print clean(m)
f.close()
那么交易是什么?我已经尝试过睡眠,超时,增加最大连接次数,但失败了。
我的赌注是愚蠢的。
答案 0 :(得分:0)
这很可能是由于' \ n' domain.txt文件行末尾的字符。以下可能有效:
r = requests.get(line.strip(), timeout=7)