AutoIt StringRegExp |保存到文件

时间:2011-12-01 13:04:59

标签: regex autoit

我需要AutoIt StringRegExp的帮助。

我想从像这样的html文件中删除代理:

<td>
<center>
<a class="proxyList" href="http://whois.sc/77.79.9.229" target="_blank">77.79.9.229:80</a>
<a class="proxyList" href="http://whois.sc/77.79.9.225" target="_blank">77.79.9.225:80</a>
<a class="proxyList" href="http://whois.sc/89.202.194.17"
target="_blank">89.202.194.17:8080</a>
<a class="proxyList" href="http://whois.sc/46.20.35.78" target="_blank">46.20.35.78:8080</a>
</td>

这是我可怕的自动代码(它的工作原理:/):

ClipPut(_IEBodyReadHTML($oIE))

 $ips = ClipGet() $array = StringRegExp($ips,' <center> * </td>', 3)

 $file = FileOpen("proxies.txt", 1)

 FileWrite($file, $array)

 FileClose($file)

这就是我想要的:

proxies.txt:
77.79.9.229:80 
77.79.9.225:80
89.202.194.17:8080
46.20.35.78:8080

感谢您的帮助:)

1 个答案:

答案 0 :(得分:3)

我不知道AutoIt正则表达式的味道,但如果它与PCRE类似,那么你的正则表达式意味着:

 <center>  : a space folowed by literal <center>
 *         : a space 0 or more times folowed by a space
</td>      : literal </td>

我不太确定这是你想要的; - )

要捕获IP和端口,您应该执行以下操作:

(\d{1,3}(?:\.\d{1,3}){3}:\d{1,5})