以下问题看起来很像很多关于SO的相关问题(我已经通过它们阅读但我的问题略有不同并且仍然存在)。
我使用词干库在Python 3.6.1中编写了以下代码(在macOS Sierra和Ubuntu上都进行了测试)。所有这一切都是创建一个新的tor进程(配置为使用意大利语ip),打开一个控制器连接,并在尝试获取新的身份标识并等待30秒后检查IP。
我的代码只不过是一个稍微修改过的版本库文档的版本,因此预计会有效。
所有代码似乎表现得很好,我没有得到任何错误/异常,但每次我得到相同的IP(偶尔会有第二个IP,但在两者之间切换)
这是代码(main.py):
import stem.process
import pycurl
import io
import time
from stem.util import term
from stem.control import Controller
from stem import Signal
TOR_HOST = '127.0.0.1'
TOR_SOCKS_PORT = 9050
TOR_CONTROL_PORT = 9051
TOR_LANG = 'it'
SITE_URL = 'https://www.atagar.com/echo.php'
def print_bootstrap_lines(line):
if "Bootstrapped " in line:
print(term.format(line, term.Color.BLUE))
def query(url):
output = io.BytesIO()
conn = pycurl.Curl()
conn.setopt(pycurl.URL, url)
conn.setopt(pycurl.PROXY, TOR_HOST)
conn.setopt(pycurl.PROXYPORT, TOR_SOCKS_PORT)
conn.setopt(pycurl.PROXYTYPE, pycurl.PROXYTYPE_SOCKS5_HOSTNAME)
conn.setopt(pycurl.WRITEFUNCTION, output.write)
try:
conn.perform()
return output.getvalue().decode('ascii')
except pycurl.error as exc:
return "Unable to reach %s (%s)" % (url, exc)
tor = stem.process.launch_tor_with_config(
config={
'SocksPort': str(TOR_SOCKS_PORT),
'ControlPort': str(TOR_CONTROL_PORT),
'ExitNodes': '{' + TOR_LANG + '}'
},
init_msg_handler=print_bootstrap_lines
)
ctrl = Controller.from_port(TOR_HOST, port=TOR_CONTROL_PORT)
ctrl.authenticate()
print(query(SITE_URL))
for _ in range(10):
ctrl.signal(Signal.NEWNYM)
time.sleep(30)
print(query(SITE_URL))
ctrl.close()
tor.kill()
这是程序输出:
/Library/Frameworks/Python.framework/Versions/3.6/bin/python3.6 /Users/tommaso/PycharmProjects/test/main.py
May 16 16:33:15.000 [notice] Bootstrapped 0%: Starting
May 16 16:33:16.000 [notice] Bootstrapped 80%: Connecting to the Tor network
May 16 16:33:17.000 [notice] Bootstrapped 85%: Finishing handshake with first hop
May 16 16:33:17.000 [notice] Bootstrapped 90%: Establishing a Tor circuit
May 16 16:33:17.000 [notice] Bootstrapped 100%: Done
IP Address: 162.220.246.230 (162.220.246.230:45631)
Locale:
IP Address: 162.220.246.230 (162.220.246.230:33604)
Locale:
IP Address: 5.249.145.164 (torexit-readme.balist.es:42397)
Locale:
IP Address: 162.220.246.230 (162.220.246.230:53925)
Locale:
IP Address: 162.220.246.230 (162.220.246.230:42953)
Locale:
IP Address: 162.220.246.230 (162.220.246.230:60250)
Locale:
IP Address: 162.220.246.230 (162.220.246.230:55945)
Locale:
IP Address: 162.220.246.230 (162.220.246.230:44077)
Locale:
IP Address: 5.249.145.164 (torexit-readme.balist.es:46375)
Locale:
IP Address: 162.220.246.230 (162.220.246.230:33205)
Locale:
IP Address: 5.249.145.164 (torexit-readme.balist.es:47870)
Locale:
Process finished with exit code 0
你知道我为什么每次都获得相同的1-2个IP / IP,以及如何修复它?我不确定这里出了什么问题。 也许意大利只有两个出口节点(意大利IP)?
由于
答案 0 :(得分:2)
您的代码看起来很好,它似乎根据您的评论和我看到的输出而正常工作。
在意大利的64-79个节点中,您在该页面上看到,实际上只有少数节点退出(您需要查看图标标志以确定这一点)。根据{{3}} 你认为意大利的出口要少得多。在撰写本文时,似乎有大约6个退出网站。
至少有一个具有非常低的容量(75 KiB / s)并且可能无法满足您的请求,而另一个我看到的不允许在端口80或443上退出流量(所以它不适合也不会被选中供您使用)。
总而言之,你只能获得2个IP的声音。这是一个网络容量问题(因为您所希望的国家/地区没有合适的退出数量),而不是代码问题。