将一维字符串数组转换为二维浮点数组

时间:2019-12-30 08:59:37

标签: python arrays numpy

我正在尝试将列表的数据类型转换为float。我知道如何使用for循环转换每个列表的数据类型,但是,我真的不知道如何转换列表的每个项目的数据类型,即,我有一个数组,数据类型为

array(['5, 0, -150, 0', '6, 0, -10, 0',
       '7, 2.5881904510252, 9.6592582628907, 0',
       '8, 5, 8.6602540378444, 0',
       '9, 7.0710678118655, 7.0710678118655, 0',
       '10, 8.6602540378444, 5, 0'], dtype='<U63')

然后,如何构建二维数组作为float数据类型的6x4数组?

2 个答案:

答案 0 :(得分:3)

在该数组上进行迭代,在定界符上拆分这些字符串,然后使它们成为float数据类型。

>>> arr2 = np.array([np.array([float(i.strip()) for i in j.split(',') if i]) for j in arr1])
>>> arr2
array([[   5.        ,    0.        , -150.        ,    0.        ],
       [   6.        ,    0.        ,  -10.        ,    0.        ],
       [   7.        ,    2.58819045,    9.65925826,    0.        ],
       [   8.        ,    5.        ,    8.66025404,    0.        ],
       [   9.        ,    7.07106781,    7.07106781,    0.        ],
       [  10.        ,    8.66025404,    5.        ,    0.        ]])
>>> arr2.dtype
dtype('float64')

答案 1 :(得分:0)

In [72]: arr = np.array(['5, 0, -150, 0', '6, 0, -10, 0', 
    ...:        '7, 2.5881904510252, 9.6592582628907, 0', 
    ...:        '8, 5, 8.6602540378444, 0', 
    ...:        '9, 7.0710678118655, 7.0710678118655, 0', 
    ...:        '10, 8.6602540378444, 5, 0'], dtype='<U63')                     

其他人提出的列表理解是正确的方法,但是可以简化:

In [73]: [line.split(',') for line in arr]                                      
Out[73]: 
[['5', ' 0', ' -150', ' 0'],
 ['6', ' 0', ' -10', ' 0'],
 ['7', ' 2.5881904510252', ' 9.6592582628907', ' 0'],
 ['8', ' 5', ' 8.6602540378444', ' 0'],
 ['9', ' 7.0710678118655', ' 7.0710678118655', ' 0'],
 ['10', ' 8.6602540378444', ' 5', ' 0']]

np.array可以处理嵌套列表,并转换为float:

In [74]: np.array(_, dtype=float)                                                     
Out[74]: 
array([[   5.        ,    0.        , -150.        ,    0.        ],
       [   6.        ,    0.        ,  -10.        ,    0.        ],
       [   7.        ,    2.58819045,    9.65925826,    0.        ],
       [   8.        ,    5.        ,    8.66025404,    0.        ],
       [   9.        ,    7.07106781,    7.07106781,    0.        ],
       [  10.        ,    8.66025404,    5.        ,    0.        ]])

原始对象是数组而不是列表的事实并不能增强此转换。实际上,在数组上进行迭代比在等效列表上进行迭代要慢。