我有一个返回numpy数组的函数。我用不同的数据文件循环了此函数,但最终会在每个循环中给出不同大小的数组(这是所需的输出),但是我无法弄清楚如何正确附加这些数组。显示了示例数组以及在我从文件中获取数据后用于排列它们的方法:
a1 = np.array([1,2,3])
a2 = np.vstack(a1)
# array([[1],
[2],
[3]])
b1 = np.array([4,5,6,7])
b2 = np.vstack(b2)
# array([[4],
[5],
[6],
[7]])
简而言之,我有两个数组,其中一个数组包含3个元素,一个数组包含4个元素。我想垂直排列它们,使其看起来像这样:
1 4
2 5
3 6
7
我不希望用零或Na填充数据中的空白,因为那样会增加工作量。
这需要对列宽为2的垂直数组进行操作,以使输出数据的组织如下:
1 2 5 6 10 11
2 3 6 7 11 12
3 4 7 8 12 13
8 9
因此,第一个循环将生成此垂直的3,2数组,而该循环的第二个迭代将生成4,2数组,在这里我想将4,2数组附加或连接到原始3,2数组,以此类推。这些数组的总宽度将始终为2,但长度将从每2个数组开始改变。
我尝试使用基本的np.column_stack
,np.concatenate
和np.append
函数,但是它们没有用。如果可以更好地工作,甚至可以在数据框中组织输出的数据,则可以使用列表而不是numpy数组。
========更新=======
更具体地讲,在尝试了此处提供的某些解决方案之后,有关我的问题的更多详细信息。 我的函数从一个数据文件中获取数据(工作正常),该文件返回2个维数相同的值的列表或数组(无论哪个)(这里也没有问题)。
现在,我正在尝试遍历目录中的所有文件时执行此操作,我想将每个文件的这两个列表(或数组)一起附加/连接在一起,但它们的大小可能不同。当我尝试将它们垂直放置以产生输出数据的列时,就会出现问题。另外,我还需要对循环中的值进行简单的数学运算,因此我认为它们可能需要是numpy数组(或类似的东西)而不是列表。
循环1返回:
outdata1 = [0.0012, 0.0013, 0.00124, 0.00127]
outdata2 = [0.0016, 0.0014, 0.00134, 0.0013]
2号循环返回:
outdata1 = [0.00155, 0.00174, 0.0018]
outdata2 = [0.0019, 0.0020, 0.0021]
以此类推...
现在我需要对它们进行数学运算,然后将它们吐入垂直组织的列数据中,而不会中断任何数据。可以通过将Na放在空间中或使用数据框(如果可行)来完成,我可以在导出之前纠正这些空间。我希望它看起来像这样:
0.0012 0.0016 0.00155 0.0019
0.0013 0.0014 0.00174 0.0020
0.00124 0.00134 0.0018 0.0021
0.00127 0.0013
答案 0 :(得分:1)
首先,数组上的vstack
将数组视为第一维上的列表。然后,将每个“行/元素”放入一个二维数组,并将它们连接起来。
这些都做同样的事情:
In [94]: np.vstack(np.array([1,2,3]))
Out[94]:
array([[1],
[2],
[3]])
In [95]: np.vstack([[1],[2],[3]])
Out[95]:
array([[1],
[2],
[3]])
In [96]: np.concatenate(([[1]],[[2]],[[3]]), axis=0)
Out[96]:
array([[1],
[2],
[3]])
匹配的数组或列表可以是'column_stack'-将该数组转换为(n,1)个数组,然后在第二维上进行连接:
In [97]: np.column_stack(([1,2,3], [4,5,6]))
Out[97]:
array([[1, 4],
[2, 5],
[3, 6]])
但是参差不齐的数组不起作用。
不同大小的列表/数组的数组具有对象dtype,并且在许多方面类似于列表列表:
In [98]: np.array(([1,2,3],[4,5,6,7]))
Out[98]: array([list([1, 2, 3]), list([4, 5, 6, 7])], dtype=object)
您的最后一个结构可以写成一个破烂的列表列表:
In [100]: [[1,2,5,6,10,11],[2,3,6,7,11,12],[3,4,7,8,12,13],[8,9]]
Out[100]: [[1, 2, 5, 6, 10, 11], [2, 3, 6, 7, 11, 12], [3, 4, 7, 8, 12, 13], [8, 9]]
In [101]: np.array(_)
Out[101]:
array([list([1, 2, 5, 6, 10, 11]), list([2, 3, 6, 7, 11, 12]),
list([3, 4, 7, 8, 12, 13]), list([8, 9])], dtype=object)
请注意,尽管这并未使[8,9]与其他对齐。您需要某种填充物/垫片。 Python列表zip_longest
提供了以下内容:
In [102]: from itertools import zip_longest
In [103]: alist = [[1,2,3],[2,3,4],[5,6,7,8],[11,12,13]]
In [104]: list(zip_longest(*alist))
Out[104]: [(1, 2, 5, 11), (2, 3, 6, 12), (3, 4, 7, 13), (None, None, 8, None)]
通过这种填充,我们可以创建一个2d数组(由于没有,因此是对象dtype):
In [105]: np.array(_)
Out[105]:
array([[1, 2, 5, 11],
[2, 3, 6, 12],
[3, 4, 7, 13],
[None, None, 8, None]], dtype=object)
===
我可以使用一个小功能在您上一次显示时生成数字:
In [232]: def foo(i,n):
...: return np.column_stack((np.arange(i,i+n), np.arange(i+1,i+1+n)))
...:
In [233]: foo(1,3)
Out[233]:
array([[1, 2],
[2, 3],
[3, 4]])
In [234]: foo(5,4)
Out[234]:
array([[5, 6],
[6, 7],
[7, 8],
[8, 9]])
In [235]: foo(10,3)
Out[235]:
array([[10, 11],
[11, 12],
[12, 13]])
我可以将所有这些数组放在列表中:
In [236]: [Out[233], Out[234], Out[235]]
Out[236]:
[array([[1, 2],
[2, 3],
[3, 4]]), array([[5, 6],
[6, 7],
[7, 8],
[8, 9]]), array([[10, 11],
[11, 12],
[12, 13]])]
我可以将该列表转换为对象dtype数组:
In [237]: np.array([Out[233], Out[234], Out[235]])
Out[237]:
array([array([[1, 2],
[2, 3],
[3, 4]]),
array([[5, 6],
[6, 7],
[7, 8],
[8, 9]]),
array([[10, 11],
[11, 12],
[12, 13]])], dtype=object)
我还可以使用以下命令显示这些数组的几行:
In [238]: for i in range(3):
...: print(np.hstack([a[i,:] for a in Out[236]]))
...:
[ 1 2 5 6 10 11]
[ 2 3 6 7 11 12]
[ 3 4 7 8 12 13]
但是要显示仅存在于中间数组的第四行,我将不得不添加更多代码以测试我们是否结束,是否添加填充等。对您来说,如果真的很重要。 :)
答案 1 :(得分:0)
既然您提到列表可以,为什么不使用此类“垂直数组”的列表呢?:
my_list = []
while (not_done_yet):
two_col_array = your_func (some_param) # your_func returns (x,2) array
my_list.append(two_col_array)
my_list
现在将是形状为(x,2)
的数组的列表,其中x
对于列表中的不同数组可能会有所不同。