Python:将字符串解析为数组

时间:2016-11-20 18:56:01

标签: python arrays string numpy

我目前遇到的问题是将字符串解析为numpy数组。

字符串看起来像这样:

input = '{{13,1},{2,1},{4,4},{1,7},{9,1}}'

字符串表示稀疏向量,其中向量本身由大括号分隔。每个条目本身用大括号分隔,表示哪些索引具有哪些条目。列表中的第一个条目对向量的维度进行编码。

在上面的例子中,向量的长度为13,有4个条目与0不同。

output = np.array([0,7,1,0,4,0,0,0,0,1,0,0,0])

将其解析为数组后,我必须解析为密集格式的字符串,格式为:

stringoutput = '{0,7,1,0,4,0,0,0,0,1,0,0,0}'

虽然我设法将numpy数组解析为字符串,但我遇到了错误括号的问题(即array2string函数中的构建使用[],而我需要{})

我愿意接受任何有助于解决此问题的建议(即使对于大型稀疏向量)。

谢谢。

\ edit:给定的向量始终是一维的,即第一个{}中的第二个数字将始终为1.(并且您只需要1个索引来定位元素的位置)

3 个答案:

答案 0 :(得分:2)

这是一种numpythonic方式:

In [132]: inp = '{{13,1},{2,1},{4,4},{1,7},{9,1}}'

# Relace the brackets with parenthesis in order to convert the string to a valid python object.
In [133]: inp = ast.literal_eval(inp.replace('{', '(').replace('}', ')'))
# Unpack the dimention and rest of then values from input object
In [134]: dim, *rest = inp
# Creat the zero array based on extracted dimention 
In [135]: arr = np.zeros(dim)
# use `zip` to collecte teh indices and values separately in order to be use in `np.put`
In [136]: indices, values = zip(*rest)

In [137]: np.put(arr, indices, values)

In [138]: arr
Out[138]: 
array([[ 0.],
       [ 7.],
       [ 1.],
       [ 0.],
       [ 4.],
       [ 0.],
       [ 0.],
       [ 0.],
       [ 0.],
       [ 1.],
       [ 0.],
       [ 0.],
       [ 0.]])

答案 1 :(得分:1)

我喜欢@ Kasramvd的方法,但我想我也把它放在那里:

In [116]: r = (list(map(int, a.split(','))) for a in input[2:-2].split('},{'))

In [118]: l = np.zeros(next(r)[0], np.int)

In [119]: for a in r:
     ...:     l[a[0]] = a[1]
     ...:    

In [122]: s = '{' + ','.join(map(str, l)) + '}'

In [123]: s
Out[123]: '{0,7,1,0,4,0,0,0,0,1,0,0,0}'

答案 2 :(得分:1)

这是基于@ Kasramvd的回答。我调整了其他值的填充方式。

来自@Kasramvd的

import numpy as np
import ast

inp = '{{13,1},{2,1},{4,4},{1,7},{9,1}}'
inp = ast.literal_eval(inp.replace('{', '(').replace('}', ')'))
dim, *rest = inp

我的调整

a = np.zeros(dim, dtype=int)
r = np.array(rest)
a[r[:, 0], 0] = r[:, 1]

a

array([[0],
       [7],
       [1],
       [0],
       [4],
       [0],
       [0],
       [0],
       [0],
       [1],
       [0],
       [0],
       [0]])

在一个维度

a = np.zeros(dim[0], dtype=int)
r = np.array(rest)
a[r[:, 0]] = r[:, 1]

a

array([0, 7, 1, 0, 4, 0, 0, 0, 0, 1, 0, 0, 0])