元组Numpy数据类型

时间:2011-09-22 13:37:31

标签: python sqlite numpy

我目前正在通过以下方式从sqlite数据库中读取颜色:

import numpy as np, apsw
connection = apsw.Connection(db_name)
cursor = connection.cursor()
desc = {'names':('name','R','G','B'),'formats':('a3','float','float','float')}
colorlist = np.array(cursor.execute("SELECT name, R, G, B FROM Colors").fetchall(),desc)

但是我希望在只有两列的numpy数组中读取这些数据,其中第二列是包含(R,G,B)的元组,例如:

desc = {'names':('name','Color'),'formats':('a3','float_tuple')}
colorlist = np.array(cursor.execute("SELECT name, R, G, B FROM Colors").fetchall(),desc)

我想这样做是为了简化我后来的一些语句,我将数组中的颜色作为元组提取出来,并且无需为我创建字典来创建这个:

colorlist[colorlist['name']=='BOS']['Color'][0]

谢谢!

1 个答案:

答案 0 :(得分:5)

你真的需要tuple吗?或者您只是希望将值分组?您可以为每个字段创建一个具有任意形状的numpy记录数组...

>>> np.array([('ABC', (1, 2, 3)), ('CBA', (3, 2, 1))], dtype='3a, 3i')
array([('ABC', [1, 2, 3]), ('CBA', [3, 2, 1])], 
      dtype=[('f0', '|S3'), ('f1', '<i4', 3)])

这甚至适用于n维数组:

>>> np.array([('ABC', ((1, 2, 3), (1, 2, 3))), ('CBA', ((3, 2, 1), (3, 2, 1)))],
             dtype='a3, (2, 3)i')
array([('ABC', [[1, 2, 3], [1, 2, 3]]), ('CBA', [[3, 2, 1], [3, 2, 1]])], 
      dtype=[('f0', '|S3'), ('f1', '<i4', (2, 3))])

部分适用于您的具体问题:

>>> desc = {'names':('name','Color'),'formats':('a3','3f')}
>>> colorlist = np.array([('ABC', (1, 2, 3)), ('CBA', (3, 2, 1))], desc)
>>> colorlist[colorlist['name']=='ABC']['Color'][0]
array([ 1.,  2.,  3.], dtype=float32)

使用rec.fromarrays从两个常规数组生成记录数组:

>>> desc = {'names':('name','Color'),'formats':('a3','3f')}
>>> np.rec.fromarrays([['ABC', 'CBA'], [(1, 2, 3), (3, 2, 1)]], desc)[0][1]
array([ 1.,  2.,  3.], dtype=float32)

完整的解决方案:

color_query = cursor.execute("SELECT R, G, B FROM Colors").fetchall()
name_query = cursor.execute("SELECT name FROM Colors").fetchall()
desc = {'names':('name','Color'),'formats':('a3','3f')}
colorlist = np.rec.fromarrays([color_query, name_query], desc)

如果由于某种原因你不能像这样拆分查询,你只需要拆分查询的结果,也许使用列表理解:

colorlist = np.rec.fromarrays([[row[0]  for row in query], 
                               [row[1:] for row in query]], desc)