在Python中(也使用numpy)我有一个列表列表列表,每个列表的长度不同。
[
[
["header1","header2"],
["---"],
[],
["item1","value1"]
],
[
["header1","header2","header3"],
["item2","value2"],
["item3","value3","value4","value5"]
]
]
我希望将此数据结构设为矩形:即保证len(list[x])
对于所有x
都是常量,len(list[x][y])
对于所有x,y等都是常量。
(这是因为我想将数据结构导入numpy)
我可以想到各种非常规方式来做这样的事情(迭代结构,记录每个级别的最大长度,第二次传递和填充值None
,但必须有更好的方法。
(我也希望解决方案不依赖于结构的维度;即它也应该适用于此类结构的列表......)
是否有一种简单的方法可以解决这个问题?
答案 0 :(得分:1)
您可以创建具有所需尺寸的ndarray
,并随时阅读您的清单。由于您的列表不完整,因此您必须抓住IndexError
,这可以在try / exception
块中完成。
使用numpy.ndenumerate
可以让解决方案轻松扩展到更多维度(在下面的for循环中添加更多索引i,j,k,l,m,n,...
):
import numpy as np
test = [ [ ["header1","header2"],
["---"],
[],
["item1","value1"] ],
[ ["header1","header2","header3"],
["item2","value2"],
["item3","value3","value4","value5"] ] ]
collector = np.empty((2,4,4),dtype='|S20')
for (i,j,k), v in np.ndenumerate( collector ):
try:
collector[i,j,k] = test[i][j][k]
except IndexError:
collector[i,j,k] = ''
print collector
#array([[['header1', 'header2', '', ''],
# ['---', '', '', ''],
# ['', '', '', ''],
# ['item1', 'value1', '', '']],
# [['header1', 'header2', 'header3', ''],
# ['item2', 'value2', '', ''],
# ['item3', 'value3', 'value4', 'value5'],
# ['', '', '', '']]], dtype='|S10')