我需要从HP Vertica数据库中提取大量数据并将其保存到文件中。我正在使用Vertica的官方ODBC驱动程序和pyodbc。
这是我到目前为止所做的:
cnxn = pyodbc.connect('DRIVER={Vertica};SERVER=localhost;DATABASE=db;UID=user;PWD=pw')
cnxn.setdecoding(pyodbc.SQL_CHAR, encoding='utf-8')
cnxn.setdecoding(pyodbc.SQL_WCHAR, encoding='utf-8')
cnxn.setencoding(str, encoding='utf-8')
cnxn.setencoding(unicode, encoding='utf-8')
cur = cnxn.cursor()
cur.execute("SELECT * FROM schema.table LIMIT 3")
然后我读了数据
for row in cur:
print row
大多数字段都返回正常 - unicode文本,数字或日期时间。但是对于存储IP地址的字段,我得到以下内容:
bytearray(b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\xff\xff\no\x19\\')
如何将其转换为文字?
非常感谢任何帮助!
谢谢!
答案 0 :(得分:3)
我看到有一个被接受的答案,但......对所有其他人来说:
如果你的数据在Vertica中,非常要做的第一件事就是检查精细的SQL参考手册。在这种情况下,您将找到一个内置函数,将表示为VARBINARY列的IPv6地址转换为字符串。
更简单,更快,更快:
SELECT V6_NTOA(your_column_here) ;
答案 1 :(得分:1)
VARBINARY(16)是128位,这是IPv6地址的正确大小。样本数据解码为
0000:0000:0000:0000:0000:ffff:0a6f:195c
和关于IPv6的维基百科文章的“IPv4映射的IPv6地址”小节(参考:here)说这样的地址是映射到IPv6格式(128位)的IPv4地址(32位)
::ffff:10.111.25.92
我们可以使用如下函数从原始bytearray
数据生成上面的字符串表示:
def bytes_to_ip_address(byte_array):
if byte_array[0:12] == bytearray(b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\xff\xff'):
return '{0}.{1}.{2}.{3}'.format(byte_array[12], byte_array[13], byte_array[14], byte_array[15])
else:
return ':'.join(['{0:02x}{1:02x}'.format(byte_array[i], byte_array[i + 1]) for i in range(0, len(byte_array), 2)])
if __name__ == '__main__':
# examples
fld = bytearray(b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\xff\xff\no\x19\\')
print(bytes_to_ip_address(fld)) # 10.111.25.92
fld = bytearray(b'\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\xff\xff\no\x19\\')
print(bytes_to_ip_address(fld)) # 0100:0000:0000:0000:0000:ffff:0a6f:195c
或者,使用Python3,我们可以使用ipaddress模块:
import ipaddress
def bytes_to_ip_address(byte_array):
ip6 = ipaddress.IPv6Address(bytes(byte_array))
ip4 = ip6.ipv4_mapped
if ip4 == None:
return str(ip6)
else:
return str(ip4)
if __name__ == '__main__':
# examples
fld = bytearray(b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\xff\xff\no\x19\\')
print(bytes_to_ip_address(fld)) # 10.111.25.92
fld = bytearray(b'\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\xff\xff\no\x19\\')
print(bytes_to_ip_address(fld)) # 100::ffff:a6f:195c