将bytearray从VARBINARY(16)列转换为IP地址

时间:2017-09-28 17:50:41

标签: python arrays byte pyodbc vertica

我需要从HP Vertica数据库中提取大量数据并将其保存到文件中。我正在使用Vertica的官方ODBC驱动程序和pyodbc。

这是我到目前为止所做的:

cnxn = pyodbc.connect('DRIVER={Vertica};SERVER=localhost;DATABASE=db;UID=user;PWD=pw')
cnxn.setdecoding(pyodbc.SQL_CHAR, encoding='utf-8')
cnxn.setdecoding(pyodbc.SQL_WCHAR, encoding='utf-8')
cnxn.setencoding(str, encoding='utf-8')
cnxn.setencoding(unicode, encoding='utf-8')
cur = cnxn.cursor()
cur.execute("SELECT * FROM schema.table LIMIT 3")

然后我读了数据

for row in cur:
    print row

大多数字段都返回正常 - unicode文本,数字或日期时间。但是对于存储IP地址的字段,我得到以下内容:

bytearray(b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\xff\xff\no\x19\\')

如何将其转换为文字?

非常感谢任何帮助!

谢谢!

2 个答案:

答案 0 :(得分:3)

我看到有一个被接受的答案,但......对所有其他人来说:

如果你的数据在Vertica中,非常要做的第一件事就是检查精细的SQL参考手册。在这种情况下,您将找到一个内置函数,将表示为VARBINARY列的IPv6地址转换为字符串。

更简单,更快,更快:

SELECT V6_NTOA(your_column_here) ;

答案 1 :(得分:1)

VARBINARY(16)是128位,这是IPv6地址的正确大小。样本数据解码为

0000:0000:0000:0000:0000:ffff:0a6f:195c

和关于IPv6的维基百科文章的“IPv4映射的IPv6地址”小节(参考:here)说这样的地址是映射到IPv6格式(128位)的IPv4地址(32位)

::ffff:10.111.25.92

我们可以使用如下函数从原始bytearray数据生成上面的字符串表示:

def bytes_to_ip_address(byte_array):
    if byte_array[0:12] == bytearray(b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\xff\xff'):
        return '{0}.{1}.{2}.{3}'.format(byte_array[12], byte_array[13], byte_array[14], byte_array[15])
    else:
        return ':'.join(['{0:02x}{1:02x}'.format(byte_array[i], byte_array[i + 1]) for i in range(0, len(byte_array), 2)])


if __name__ == '__main__':
    # examples
    fld = bytearray(b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\xff\xff\no\x19\\')
    print(bytes_to_ip_address(fld))  # 10.111.25.92
    fld = bytearray(b'\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\xff\xff\no\x19\\')
    print(bytes_to_ip_address(fld))  # 0100:0000:0000:0000:0000:ffff:0a6f:195c

或者,使用Python3,我们可以使用ipaddress模块:

import ipaddress


def bytes_to_ip_address(byte_array):
    ip6 = ipaddress.IPv6Address(bytes(byte_array))
    ip4 = ip6.ipv4_mapped
    if ip4 == None:
        return str(ip6)
    else:
        return str(ip4)


if __name__ == '__main__':
    # examples
    fld = bytearray(b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\xff\xff\no\x19\\')
    print(bytes_to_ip_address(fld))  # 10.111.25.92
    fld = bytearray(b'\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\xff\xff\no\x19\\')
    print(bytes_to_ip_address(fld))  # 100::ffff:a6f:195c