我有一个大型文件,每行包含2 IPs
- 总共大约有300万行。
以下是该文件的示例:
1.32.0.0,1.32.255.255
5.72.0.0,5.75.255.255
5.180.0.0,5.183.255.255
222.127.228.22,222.127.228.23
222.127.228.24,222.127.228.24
我需要将每个IP
转换为IP Decimal
,如下所示:
18874368,18939903
88604672,88866815
95682560,95944703
3732923414,3732923415
3732923416,3732923416
我更喜欢通过命令行严格执行此操作的方法。我可以使用perl
或python
,只要它不需要安装额外的模块。
我以为我遇到过某人使用IPs
转换sed
这样的方式,但似乎无法找到该教程。任何帮助将不胜感激。
答案 0 :(得分:3)
如果你安装了gnu awk(对于RT
变量),你可以使用这个单行:
awk -F. -v RS='[\n,]' '{printf "%d%s", (($1*256+$2)*256+$3)*256+$4, RT}' file
18874368,18939903
88604672,88866815
95682560,95944703
3732923414,3732923415
3732923416,3732923416
答案 1 :(得分:2)
这里是python
解决方案,只使用标准模块(re,sys):
import re
import sys
def multiplier_generator():
""" Cyclic generator of powers of 256 (from 256**3 down to 256**0)
The mulitpliers tupple could be replaced by inline calculation
of power, but this approach has better performance.
"""
multipliers = (
256**3,
256**2,
256**1,
256**0,
)
idx = 0
while 1 == 1:
yield multipliers[idx]
idx = (idx + 1) % 4
def replacer(match_object):
"""re.sub replacer for ip group"""
multiplier = multiplier_generator()
res = 0
for i in xrange(1,5):
res += multiplier.next()*int(match_object.group(i))
return str(res)
if __name__ == "__main__":
std_in = ""
if len(sys.argv) > 1:
with open(sys.argv[1],'r') as f:
std_in = f.read()
else:
std_in = sys.stdin.read()
print re.sub(r"([0-9]+)\.([0-9]+)\.([0-9]+)\.([0-9]+)", replacer, std_in )
此解决方案替换每个IP地址,可以在标准输入的文本中或从作为第一个参数传递的文件中找到,即:
答案 2 :(得分:1)
使用bash:
ip2dec() {
set -- ${1//./ } # split $1 with "." to $1 $2 $3 $4
declare -i dec # set integer attribute
dec=$1*256*256*256+$2*256*256+$3*256+$4
echo -n $dec
}
while IFS=, read -r a b; do ip2dec $a; echo -n ,; ip2dec $b; echo; done < file
输出:
18874368,18939903 88604672,88866815 95682560,95944703 3732923414,3732923415 3732923416,3732923416
答案 3 :(得分:0)
使用bash并使用shift(一个CPU指令)而不是乘法(很多指令):
ip2dec() { local IFS=.
set -- $1 # split $1 with "." to $1 $2 $3 $4
printf '%s' "$(($1<<24+$2<<16+$3<<8+$4))"
}
while IFS=, read -r a b; do
printf '%s,%s\n' "$(ip2dec $a)" "$(ip2dec $b)"
done < file