反转从文本文件中读取的字典的键值 - python

时间:2013-12-07 17:14:04

标签: python dictionary key text-files defaultdict

我有一个先前输出到文本文件中的字典,即[in]:

dict_from_file = """foo\tfoobar, bar, foo foo\tFoo bar language, computing\nprog\t python, java, c, c++\t computing\nedibles\tcereal, milka, whatever\tfood"""

最初,关键是第1列,别名在第2列,第3列是值,我需要转换文本文件,使得最后一列是键,第1列和第2列是值: / p>

[OUT]:

Foo bar language\tfoobar, foo, bar, foo foo
computing\tfoobar, foo, bar, foo foo, python, java, c, c++, prog
food\tcereal, milka, whatever\tedibles

这样做的目的是,在输入foo foo的情况下,getkeybyvalue()函数将返回['Foo bar language','computing']

我一直如下:

from collections import defaultdict

outdict = defaultdict(list)
def getkeybyvalue(dictionary, value):
  return [i for i,j in dictionary.items() if value in j]

dict_from_file = """foo\tfoobar, bar, foo foo\tFoo bar language, computing\nprog\t python, java, c, c++\t computing\nedibles\tcereal, milka, whatever\tfood"""

for line in dict_from_file.split('\n'):
    column1, column2, column3 = line.strip().split('\t')
    #print column1, column2, column3
    for c3 in column3.split(','):
        c3 = c3.strip(', ')
        outdict[c3].append(column1)
        for c2 in column2.split(','):
            outdict[c3].append(c2.strip(' ,'))

for k in outdict:
    print k, outdict[k]

print getkeybyvalue(outdict, 'foo foo')
  1. 是否有一种不那么冗长的方法呢?
  2. 我应该如何阅读文本文件,以便给定foo foo,我的python字典返回['Foo bar language','computing']

1 个答案:

答案 0 :(得分:1)

在回答要求示例时,您可以使用列表推导来获得技术上更紧凑的代码。我不认为它们在这里增加太多(尽管如果我们要对它们进行分析,它们对于大型数据集可能更有效)。

它们确实使代码难以阅读,所以在大多数情况下我真的不喜欢这种方法。

如果您认为您的解决方案串在一起并且您可以控制持久性代码,请以标准格式存储数据。

from collections import defaultdict

outdict = defaultdict(list)
def getkeybyvalue(dictionary, value):
    return [i for i,j in dictionary.items() if value in j]

dict_from_file = """foo\tfoobar, bar, foo foo\tFoo bar language, computing\nprog\t python, java, c, c++\t computing\nedibles\tcereal, milk, whatever\tfood"""

columns = [line.strip().split('\t') for line in dict_from_file.split('\n')]
for c1, c2, c3 in columns:
    for c3_item in c3.split(','):
        outdict[c3_item.strip(', ')] += [c1] + [c.strip(' ,') for c in c2.split(',')]

for k in outdict:
    print(k, outdict[k])

print(getkeybyvalue(outdict, 'foo foo'))