我目前遇到的问题是将字符串解析为numpy数组。
字符串看起来像这样:
input = '{{13,1},{2,1},{4,4},{1,7},{9,1}}'
字符串表示稀疏向量,其中向量本身由大括号分隔。每个条目本身用大括号分隔,表示哪些索引具有哪些条目。列表中的第一个条目对向量的维度进行编码。
在上面的例子中,向量的长度为13,有4个条目与0不同。
output = np.array([0,7,1,0,4,0,0,0,0,1,0,0,0])
将其解析为数组后,我必须解析为密集格式的字符串,格式为:
stringoutput = '{0,7,1,0,4,0,0,0,0,1,0,0,0}'
虽然我设法将numpy数组解析为字符串,但我遇到了错误括号的问题(即array2string函数中的构建使用[],而我需要{})
我愿意接受任何有助于解决此问题的建议(即使对于大型稀疏向量)。
谢谢。
\ edit:给定的向量始终是一维的,即第一个{}中的第二个数字将始终为1.(并且您只需要1个索引来定位元素的位置)
答案 0 :(得分:2)
这是一种numpythonic方式:
In [132]: inp = '{{13,1},{2,1},{4,4},{1,7},{9,1}}'
# Relace the brackets with parenthesis in order to convert the string to a valid python object.
In [133]: inp = ast.literal_eval(inp.replace('{', '(').replace('}', ')'))
# Unpack the dimention and rest of then values from input object
In [134]: dim, *rest = inp
# Creat the zero array based on extracted dimention
In [135]: arr = np.zeros(dim)
# use `zip` to collecte teh indices and values separately in order to be use in `np.put`
In [136]: indices, values = zip(*rest)
In [137]: np.put(arr, indices, values)
In [138]: arr
Out[138]:
array([[ 0.],
[ 7.],
[ 1.],
[ 0.],
[ 4.],
[ 0.],
[ 0.],
[ 0.],
[ 0.],
[ 1.],
[ 0.],
[ 0.],
[ 0.]])
答案 1 :(得分:1)
我喜欢@ Kasramvd的方法,但我想我也把它放在那里:
In [116]: r = (list(map(int, a.split(','))) for a in input[2:-2].split('},{'))
In [118]: l = np.zeros(next(r)[0], np.int)
In [119]: for a in r:
...: l[a[0]] = a[1]
...:
In [122]: s = '{' + ','.join(map(str, l)) + '}'
In [123]: s
Out[123]: '{0,7,1,0,4,0,0,0,0,1,0,0,0}'
答案 2 :(得分:1)
这是基于@ Kasramvd的回答。我调整了其他值的填充方式。
来自@Kasramvd的
import numpy as np
import ast
inp = '{{13,1},{2,1},{4,4},{1,7},{9,1}}'
inp = ast.literal_eval(inp.replace('{', '(').replace('}', ')'))
dim, *rest = inp
我的调整
a = np.zeros(dim, dtype=int)
r = np.array(rest)
a[r[:, 0], 0] = r[:, 1]
a
array([[0],
[7],
[1],
[0],
[4],
[0],
[0],
[0],
[0],
[1],
[0],
[0],
[0]])
在一个维度
a = np.zeros(dim[0], dtype=int)
r = np.array(rest)
a[r[:, 0]] = r[:, 1]
a
array([0, 7, 1, 0, 4, 0, 0, 0, 0, 1, 0, 0, 0])