级联/附加多个不同大小的垂直数组

时间:2019-03-14 05:18:27

标签: python arrays python-3.x numpy concatenation

我有一个返回numpy数组的函数。我用不同的数据文件循环了此函数,但最终会在每个循环中给出不同大小的数组(这是所需的输出),但是我无法弄清楚如何正确附加这些数组。显示了示例数组以及在我从文件中获取数据后用于排列它们的方法:

a1 = np.array([1,2,3]) 
a2 = np.vstack(a1)
# array([[1],
   [2],
   [3]])
b1 = np.array([4,5,6,7])
b2 = np.vstack(b2)
# array([[4],
   [5],
   [6],
   [7]])

简而言之,我有两个数组,其中一个数组包含3个元素,一个数组包含4个元素。我想垂直排列它们,使其看起来像这样:

1  4 
2  5
3  6
   7

我不希望用零或Na填充数据中的空白,因为那样会增加工作量。

这需要对列宽为2的垂直数组进行操作,以使输出数据的组织如下:

1  2   5  6   10  11
2  3   6  7   11  12
3  4   7  8   12  13
       8  9 

因此,第一个循环将生成此垂直的3,2数组,而该循环的第二个迭代将生成4,2数组,在这里我想将4,2数组附加或连接到原始3,2数组,以此类推。这些数组的总宽度将始终为2,但长度将从每2个数组开始改变。

我尝试使用基本的np.column_stacknp.concatenatenp.append函数,但是它们没有用。如果可以更好地工作,甚至可以在数据框中组织输出的数据,则可以使用列表而不是numpy数组。

========更新=======

更具体地讲,在尝试了此处提供的某些解决方案之后,有关我的问题的更多详细信息。 我的函数从一个数据文件中获取数据(工作正常),该文件返回2个维数相同的值的列表或数组(无论哪个)(这里也没有问题)。

现在,我正在尝试遍历目录中的所有文件时执行此操作,我想将每个文件的这两个列表(或数组)一起附加/连接在一起,但它们的大小可能不同。当我尝试将它们垂直放置以产生输出数据的列时,就会出现问题。另外,我还需要对循环中的值进行简单的数学运算,因此我认为它们可能需要是numpy数组(或类似的东西)而不是列表。

循环1返回:

outdata1 = [0.0012, 0.0013, 0.00124, 0.00127] outdata2 = [0.0016, 0.0014, 0.00134, 0.0013]

2号循环返回:

outdata1 = [0.00155, 0.00174, 0.0018] outdata2 = [0.0019, 0.0020, 0.0021]

以此类推...

现在我需要对它们进行数学运算,然后将它们吐入垂直组织的列数据中,而不会中断任何数据。可以通过将Na放在空间中或使用数据框(如果可行)来完成,我可以在导出之前纠正这些空间。我希望它看起来像这样:

0.0012 0.0016 0.00155 0.0019 0.0013 0.0014 0.00174 0.0020 0.00124 0.00134 0.0018 0.0021 0.00127 0.0013

2 个答案:

答案 0 :(得分:1)

首先,数组上的vstack将数组视为第一维上的列表。然后,将每个“行/元素”放入一个二维数组,并将它们连接起来。

这些都做同样的事情:

In [94]: np.vstack(np.array([1,2,3]))                                           
Out[94]: 
array([[1],
       [2],
       [3]])
In [95]: np.vstack([[1],[2],[3]])                                               
Out[95]: 
array([[1],
       [2],
       [3]])
In [96]: np.concatenate(([[1]],[[2]],[[3]]), axis=0)                            
Out[96]: 
array([[1],
       [2],
       [3]])

匹配的数组或列表可以是'column_stack'-将该数组转换为(n,1)个数组,然后在第二维上进行连接:

In [97]: np.column_stack(([1,2,3], [4,5,6]))                                    
Out[97]: 
array([[1, 4],
       [2, 5],
       [3, 6]])

但是参差不齐的数组不起作用。

不同大小的列表/数组的数组具有对象dtype,并且在许多方面类似于列表列表:

In [98]: np.array(([1,2,3],[4,5,6,7]))                                          
Out[98]: array([list([1, 2, 3]), list([4, 5, 6, 7])], dtype=object)

您的最后一个结构可以写成一个破烂的列表列表:

In [100]: [[1,2,5,6,10,11],[2,3,6,7,11,12],[3,4,7,8,12,13],[8,9]]               
Out[100]: [[1, 2, 5, 6, 10, 11], [2, 3, 6, 7, 11, 12], [3, 4, 7, 8, 12, 13], [8, 9]]
In [101]: np.array(_)                                                           
Out[101]: 
array([list([1, 2, 5, 6, 10, 11]), list([2, 3, 6, 7, 11, 12]),
       list([3, 4, 7, 8, 12, 13]), list([8, 9])], dtype=object)

请注意,尽管这并未使[8,9]与其他对齐。您需要某种填充物/垫片。 Python列表zip_longest提供了以下内容:

In [102]: from itertools import zip_longest                                     
In [103]: alist = [[1,2,3],[2,3,4],[5,6,7,8],[11,12,13]]                        
In [104]: list(zip_longest(*alist))                                             
Out[104]: [(1, 2, 5, 11), (2, 3, 6, 12), (3, 4, 7, 13), (None, None, 8, None)]

通过这种填充,我们可以创建一个2d数组(由于没有,因此是对象dtype):

In [105]: np.array(_)                                                           
Out[105]: 
array([[1, 2, 5, 11],
       [2, 3, 6, 12],
       [3, 4, 7, 13],
       [None, None, 8, None]], dtype=object)

===

我可以使用一个小功能在您上一次显示时生成数字:

In [232]: def foo(i,n): 
     ...:     return np.column_stack((np.arange(i,i+n), np.arange(i+1,i+1+n))) 
     ...:                                                                       
In [233]: foo(1,3)                                                              
Out[233]: 
array([[1, 2],
       [2, 3],
       [3, 4]])
In [234]: foo(5,4)                                                              
Out[234]: 
array([[5, 6],
       [6, 7],
       [7, 8],
       [8, 9]])
In [235]: foo(10,3)                                                             
Out[235]: 
array([[10, 11],
       [11, 12],
       [12, 13]])

我可以将所有这些数组放在列表中:

In [236]: [Out[233], Out[234], Out[235]]                                        
Out[236]: 
[array([[1, 2],
        [2, 3],
        [3, 4]]), array([[5, 6],
        [6, 7],
        [7, 8],
        [8, 9]]), array([[10, 11],
        [11, 12],
        [12, 13]])]

我可以将该列表转换为对象dtype数组:

In [237]: np.array([Out[233], Out[234], Out[235]])                              
Out[237]: 
array([array([[1, 2],
       [2, 3],
       [3, 4]]),
       array([[5, 6],
       [6, 7],
       [7, 8],
       [8, 9]]),
       array([[10, 11],
       [11, 12],
       [12, 13]])], dtype=object)

我还可以使用以下命令显示这些数组的几行:

In [238]: for i in range(3): 
     ...:     print(np.hstack([a[i,:] for a in Out[236]])) 
     ...:                                                                       
[ 1  2  5  6 10 11]
[ 2  3  6  7 11 12]
[ 3  4  7  8 12 13]

但是要显示仅存在于中间数组的第四行,我将不得不添加更多代码以测试我们是否结束,是否添加填充等。对您来说,如果真的很重要。 :)

答案 1 :(得分:0)

既然您提到列表可以,为什么不使用此类“垂直数组”的列表呢?:

my_list = []
while (not_done_yet):
    two_col_array = your_func (some_param) # your_func returns (x,2) array
    my_list.append(two_col_array)

my_list现在将是形状为(x,2)的数组的列表,其中x对于列表中的不同数组可能会有所不同。