Python:计算字典列表中的字符串

时间:2017-01-31 07:16:06

标签: python-2.7 list dictionary count frequency-distribution

我从斯坦福大学NER中提取了一个词典列表,并创建了如下列表:

myList = [
{'A':{},'B':['C','D'],
'names': {'PERSON': [u'John Butters', u'Bill', u'Hillary Clinton'],'LOCATION': [],
 'ORGANIZATION': [u'FactSet', u'Pfizer Inc. PFE']}},
{'A':{'Hello'},'B':['F','E'], 
'names': {'PERSON': [u'Tim Anderson', u'Hillary Clinton'], 'LOCATION': [ u'US'], 
'ORGANIZATION': [u'Goldman Sachs GS', u'ConocoPhillips COP', u'FactSet']}},
{'A':{'right'},'B':['M','N'],
'names': {'PERSON': [u'Mohammed bin Salman', u'Spano'], 'LOCATION': [u'Saudi Arabia',u'Red Sea'],
 'ORGANIZATION': [u'Aramco', u'FactSet', u'Goldman Sachs GS']}}
 ]

换句话说,我有一个如下列表:

myList = [{},{},{}]

每个字典都包含一个特定文档的详细信息。名字的关键'是一本字典:

'names':{'PERSON':[], 'LOCATION':[], 'ORGANIZATION':[]}

我打算在'名称'的关键字下提取值的频率。 ----> '组织'在整个文档中,然后计算每对名称在myList中一起出现的次数。任何帮助将不胜感激。 输出应如下所示:

{u'FactSet': 3, u'Pfizer Inc. PFE':1, u'Goldman Sachs GS':2, u'ConocoPhillips COP':1, u'Aramco':1}

最后,我想计算上述名字的共同出现次数。输出可以是:

{[u'FactSet', u'Pfizer Inc. PFE']:1, 
[u'Goldman Sachs GS', u'ConocoPhillips COP']:1,
[u'Goldman Sachs GS', u'FactSet'] :2,
[u'Aramco', u'FactSet']:1, 
[u'Aramco', u'Goldman Sachs GS']:1 }

0 个答案:

没有答案