我需要AutoIt StringRegExp的帮助。
我想从像这样的html文件中删除代理:
<td>
<center>
<a class="proxyList" href="http://whois.sc/77.79.9.229" target="_blank">77.79.9.229:80</a>
<a class="proxyList" href="http://whois.sc/77.79.9.225" target="_blank">77.79.9.225:80</a>
<a class="proxyList" href="http://whois.sc/89.202.194.17"
target="_blank">89.202.194.17:8080</a>
<a class="proxyList" href="http://whois.sc/46.20.35.78" target="_blank">46.20.35.78:8080</a>
</td>
这是我可怕的自动代码(它的工作原理:/):
ClipPut(_IEBodyReadHTML($oIE))
$ips = ClipGet() $array = StringRegExp($ips,' <center> * </td>', 3)
$file = FileOpen("proxies.txt", 1)
FileWrite($file, $array)
FileClose($file)
这就是我想要的:
proxies.txt:
77.79.9.229:80
77.79.9.225:80
89.202.194.17:8080
46.20.35.78:8080
感谢您的帮助:)
答案 0 :(得分:3)
我不知道AutoIt正则表达式的味道,但如果它与PCRE类似,那么你的正则表达式意味着:
<center> : a space folowed by literal <center>
* : a space 0 or more times folowed by a space
</td> : literal </td>
我不太确定这是你想要的; - )
要捕获IP和端口,您应该执行以下操作:
(\d{1,3}(?:\.\d{1,3}){3}:\d{1,5})