将不完整的嵌套列表放在矩形ndarray中

时间:2013-05-22 10:07:17

标签: python list numpy nested-lists multidimensional-array

在Python中(也使用numpy)我有一个列表列表列表,每个列表的长度不同。

[
    [
         ["header1","header2"],
         ["---"],
         [],
         ["item1","value1"]
    ],

    [
         ["header1","header2","header3"],
         ["item2","value2"],
         ["item3","value3","value4","value5"]
    ]
]

我希望将此数据结构设为矩形:即保证len(list[x])对于所有x都是常量,len(list[x][y])对于所有x,y等都是常量。

(这是因为我想将数据结构导入numpy)

我可以想到各种非常规方式来做这样的事情(迭代结构,记录每个级别的最大长度,第二次传递和填充值None,但必须有更好的方法。

(我也希望解决方案不依赖于结构的维度;即它也应该适用于此类结构的列表......)

是否有一种简单的方法可以解决这个问题?

1 个答案:

答案 0 :(得分:1)

您可以创建具有所需尺寸的ndarray,并随时阅读您的清单。由于您的列表不完整,因此您必须抓住IndexError,这可以在try / exception块中完成。

使用numpy.ndenumerate可以让解决方案轻松扩展到更多维度(在下面的for循环中添加更多索引i,j,k,l,m,n,...):

import numpy as np
test = [ [ ["header1","header2"],
           ["---"],
           [],
           ["item1","value1"] ],
         [ ["header1","header2","header3"],
           ["item2","value2"],
           ["item3","value3","value4","value5"] ] ]


collector = np.empty((2,4,4),dtype='|S20')

for (i,j,k), v in np.ndenumerate( collector ):
    try:
        collector[i,j,k] = test[i][j][k]
    except IndexError:
        collector[i,j,k] = ''


print collector
#array([[['header1', 'header2', '', ''],
#        ['---', '', '', ''],
#        ['', '', '', ''],
#        ['item1', 'value1', '', '']],
#       [['header1', 'header2', 'header3', ''],
#        ['item2', 'value2', '', ''],
#        ['item3', 'value3', 'value4', 'value5'],
#        ['', '', '', '']]],  dtype='|S10')