我有3个等长的数组(例如):
[a, b, c]
[1, 2, 3]
[i, ii, iii]
我想将它们组合成一个矩阵:
|a, 1, i |
|b, 2, ii |
|c, 3, iii|
我遇到的问题是,当我使用诸如dstack
,hstack
或concatenate
之类的代码时。我以一种可以使用的方式对它们进行数字添加或堆叠。
答案 0 :(得分:1)
您可以使用zip():
映射多个容器的相似索引,以便可以将它们用作单个实体使用。
a1 = ['a', 'b', 'c']
b1 = ['1', '2', '3']
c1 = ['i', 'ii', 'iii']
print(list(zip(a1,b1,c1)))
输出:
[('a', '1', 'i'), ('b', '2', 'ii'), ('c', '3', 'iii')]
编辑:
我只是想向前走,然后将列表弄平然后再使用numpy.reshape
flattened_list = []
#flatten the list
for x in res:
for y in x:
flattened_list.append(y)
#print(flattened_list)
import numpy as np
data = np.array(flattened_list)
shape = (3, 3)
print(data.reshape( shape ))
输出:
[['a' '1' 'i']
['b' '2' 'ii']
['c' '3' 'iii']]
OR
对于那里的一支班轮:
#flatten the list
for x in res:
for y in x:
flattened_list.append(y)
# print(flattened_list)
print([flattened_list[i:i+3] for i in range(0, len(flattened_list), 3)])
输出:
[['a', '1', 'i'], ['b', '2', 'ii'], ['c', '3', 'iii']]
OR
如@ norok2所建议
print(list(zip(*zip(a1, b1, c1))))
输出:
[('a', 'b', 'c'), ('1', '2', '3'), ('i', 'ii', 'iii')]
答案 1 :(得分:0)
这会给您一个元组列表,可能不是您想要的:
>>> list(zip([1,2,3],[4,5,6],[7,8,9]))
[(1, 4, 7), (2, 5, 8), (3, 6, 9)]
这为您提供了一个numpy数组:
>>> from numpy import array
>>> array([[1,2,3],[4,5,6],[7,8,9]]).transpose()
array([[1, 4, 7],
[2, 5, 8],
[3, 6, 9]])
答案 2 :(得分:0)
假设您有3个numpy数组:
>>> a, b, c = np.random.randint(0, 9, 9).reshape(3, 3)
>>> print(a, b, c)
[4 1 4] [5 8 5] [3 0 2]
然后您可以将它们垂直堆叠(即沿第一维),然后转置所得矩阵以获得所需的顺序:
>>> np.vstack((a, b, c)).T
array([[4, 5, 3],
[1, 8, 0],
[4, 5, 2]])
一个更为冗长的示例是改为水平堆叠,但这需要使用reshape
将数组制作成2D:
>>> np.hstack((a.reshape(3, 1), b.reshape(3, 1), c.reshape(3, 1)))
array([[4, 5, 3],
[1, 8, 0],
[4, 5, 2]])
答案 3 :(得分:0)
如果每个数组中的数据类型不同,则可以使用pandas
来实现此目的:
# Iterative approach, using concat
import pandas as pd
my_arrays = [['a', 'b', 'c'], [1, 2, 3], ['i', 'ii', 'iii']]
df1 = pd.concat([pd.Series(array) for array in my_arrays], axis=1)
# Named arrays
array1 = ['a', 'b', 'c']
array2 = [1, 2, 3]
array3 = ['i', 'ii', 'iii']
df2 = pd.DataFrame({'col1': array1,
'col2': array2,
'col3': array3})
现在,您具有所需的结构,并且每列都有适当的数据类型:
print(df1)
# 0 1 2
# 0 a 1 i
# 1 b 2 ii
# 2 c 3 iii
print(df2)
# col1 col2 col3
# 0 a 1 i
# 1 b 2 ii
# 2 c 3 iii
print(df1.dtypes)
# 0 object
# 1 int64
# 2 object
# dtype: object
print(df2.dtypes)
# col1 object
# col2 int64
# col3 object
# dtype: object
您可以使用numpy
属性提取.values
数组:
df1.values
# array([['a', 1, 'i'],
# ['b', 2, 'ii'],
# ['c', 3, 'iii']], dtype=object)