Question

我有一个这样的字典，其键比所示的要多数千个，每个字母a，b，c的数百个值：

dictex = {'cat': {'a': [[1, 3, 5], [2, 2, 7]], 'b': [[1, 3, 7], [2, 2, 7]], 'c': [[1, 2, 7], [2, 2, 7]]},
          'dog': {'a': [[1, 2, 5], [2, 2, 7]], 'b': [[1, 2, 7], [2, 2, 7]], 'c': [[1, 3, 7], [2, 2, 7]]},
          'moose': {'a': [[1, 1, 5], [2, 2, 7]], 'b': [[1, 1, 7], [2, 2, 7]], 'c': [[1, 1, 7], [2, 2, 7]]}}

我想为每个条目从第二个值中减去第一个值，然后对所有a，所有b和所有c求和。例如，对于cat的{{1}}项，运算为（5-3）+（7-2）。首选输出是（.csv）：

我可以使用来获得特定的动物和字母差异

animal a   b   c
cat    7   9   10
dog    8   10  9
moose  9   11  11

我不确定如何以智能的方式（不需要大量的手动输入）为每个条目获取此信息，然后将其输出为上述形式。

Answer 1

您可以定义一个单独的方法来获取列表中所有列表的第二个元素和第一个元素之间所有差的总和，然后使用“字典理解”生成result：

def diff_sums(l):
    return sum(x[2] - x[1] for x in l)

dictex = {'cat': {'a': [[1, 3, 5], [2, 2, 7]], 'b': [[1, 3, 7], [2, 2, 7]], 'c': [[1, 2, 7], [2, 2, 7]]},
          'dog': {'a': [[1, 2, 5], [2, 2, 7]], 'b': [[1, 2, 7], [2, 2, 7]], 'c': [[1, 3, 7], [2, 2, 7]]},
          'moose': {'a': [[1, 1, 5], [2, 2, 7]], 'b': [[1, 1, 7], [2, 2, 7]], 'c': [[1, 1, 7], [2, 2, 7]]}}

result = {animal: {k: diff_sums(v) for k, v in num_lists.items()} for animal, num_lists in dictex.items()}
print(result)

输出

{'cat': {'a': 7, 'b': 9, 'c': 10}, 
 'dog': {'a': 8, 'b': 10, 'c': 9}, 
 'moose': {'a': 9, 'b': 11, 'c': 11}}

要将其写入CSV文件，您可以使用csv模块：

import csv

columns = ['animal', 'a', 'b', 'c']
data = [[animal] + [v[c] for c in columns[1:]] for animal, v in result.items()]
with open('mydata.csv', 'w') as csvfile:
    writer = csv.writer(csvfile, delimiter=',')
    for line in [columns] + data:
        writer.writerow(line)

输出

animal,a,b,c
cat,7,9,10
dog,8,10,9
moose,9,11,11

Answer 2

如果可以使用pandas，可以使用该库编写它。

通常，将列表放入数据帧并不是一个好主意，但是我们只进行一些温和的处理，然后将结果保存到csv文件中。

pd.DataFrame(dictex).rename_axis('animal', 1).applymap(lambda lists: sum(l[2]-l[1] for l in lists)).T.to_csv('f.csv')

这将导致文件

animal,a,b,c
cat,7,9,10
dog,8,10,9
moose,9,11,11

Answer 3

如果您发现自己必须一遍又一遍地进行某些计算，那么那时候最好是编写一个函数。这是一个函数，它使用字典（如dictex，动物名称和字母），并为您返回单独的计算：

# Do the calculations for a particular animal and letter
def calculate_value(mydict, animal, letter):
    W = mydict[animal][letter][0][2]
    X = mydict[animal][letter][0][1]
    Y = mydict[animal][letter][1][2]
    Z = mydict[animal][letter][1][1]

    # Do the math and convert the resulting number to a string,
    # which will save us some headaches when writing to the csv file.
    return str((W-X) + (Y-Z))

这是遍历整个词典的函数，计算每个动物和字母的值，然后最终将结果返回到列表列表中，如下所示：[ ['cat',7,9,10], ['dog',8,10,9], ... ]等。

def make_new_list(my_dict):
    new_list = []
    for animal in my_dict:
        individual_animal_list = [animal]
        for letter in ['a', 'b', 'c']:
            individual_animal_list.append(calculate_value(my_dict, animal, letter))
        new_list.append(individual_animal_list)
    return new_list

之所以使用上述格式，是因为它使将结果写入CSV文件变得容易得多。只需获取您从上一个函数中获得的每个列表，将所有内容之间用逗号隔开，然后将其作为一行写到文件中即可：

dictex = {'cat': {'a': [[1, 3, 5], [2, 2, 7]], 'b': [[1, 3, 7], [2, 2, 7]], 'c': [[1, 2, 7], [2, 2, 7]]},
          'dog': {'a': [[1, 2, 5], [2, 2, 7]], 'b': [[1, 2, 7], [2, 2, 7]], 'c': [[1, 3, 7], [2, 2, 7]]},
          'moose': {'a': [[1, 1, 5], [2, 2, 7]], 'b': [[1, 1, 7], [2, 2, 7]], 'c': [[1, 1, 7], [2, 2, 7]]}}

new_list = make_new_list(dictex)

with open('my_file.csv', 'w') as f:
    f.write('animal,a,b,c\n') # Write the header line
    for row in new_list:
        f.write(','.join(row))
        f.write('\n')

请记住，Python中的字典没有顺序。因此，生成的文件不一定要使动物行的顺序与原始词典中出现的顺序相同。

字典：将一系列字典值中的第一个条目减去第二个条目

3 个答案: