阅读矩阵在python中包含字典

时间:2016-06-21 18:43:05

标签: python matrix nlp

我有两个矩阵(我希望它们用于部分语音标记)。第一个包含pos标签概率,第二个包含单词概率。我需要提取数字并对矩阵求和。问题是当我调用每个单元格时,字符串部分也出现了。但我需要数字。我怎么称呼他们。 (这是制作矩阵的正确方法吗?如果没有,我如何用行和列的标题中的标记来纠正它?)

import numpy as np
A = np.array([[{'ARTART':0}],[{'ARTN':1}],[{'ARTV':0}],[{'ARTP':0}],
          [{'NART':0}],[{'NN':0.13}],[{'NV':0.43}],[{'NP':0.44}],
          [{'VART':0.65}],[{'VN':0.35}],[{'VV':0}],[{'VP':0}],
          [{'PART':0.74}],[{'PN':0.26}],[{'PV':0}],[{'PP':0}],
          [{'NULLART':0.71}],[{'NULLN':0.29}],[{'NULLV':0}],[{'NULLP':0}]]).reshape(5,4)
          #print (A)

B = np.array([[{'ARTflies':0}],[{'ARTlike':0}],[{'ARTa':0.36}],[{'ARTflower':0}],
          [{'Nflies':0.025}],[{'Nlike':0.012}],[{'Na':0.001}],[{'Nflower':0.063}],
          [{'Vflies':0.076}],[{'Vlike':0.1}],[{'Va':0}],[{'Vflower':0.05}],
          [{'Pflies':0}],[{'Plike':0.068}],[{'Pa':0}],[{'Pflower':0}]]).reshape(4,4)
#print (B)
#print (A[4][0])

1 个答案:

答案 0 :(得分:0)

我认为您只需使用2个词典即可完成此任务,每个词典对应一个目前正在制作的数组:

A = {'ARTART':0, 'ARTN':1, 'ARTV': 0} # and so on

然后,您可以使用以下方法获取字典中每个条目的值:

A_val = A.values()

最后,您可以将值与:

相加
A_sum = sum(A_val)