简化Python中多个哈希的使用

时间:2019-02-14 14:27:30

标签: python pandas dictionary hash

我有一个约700行和3列的CSV文件,其中包含labelrgbstring信息,例如:

str;      rgb;                   label;         color
bones;    "['255','255','255']"; 2;             (241,214,145)
Aorta;    "['255','0','0']";     17;            (216,101,79)
VenaCava; "['0','0','255']";     16;            (0,151,206)

我想创建一种简单的方法,将一个唯一的输入转换为一个唯一的输出。

一种解决方案是将所有ROIDisplayColor条目与相应的标签条目作为字典进行哈希处理,例如rgb2label

with open("c:\my_file.csv") as csv_file:
    rgb2label, label2rgb = {}, {} # rgb2str, label2str, str2label...
    for row in csv.reader(csv_file):
        rgb2label[row[1]] = row[2]
        label2rgb[row[2]] = row[1]

这可以简单地如下使用:

>>> rgb2label[ "['255','255','255']"]
'2'
>>> label2rgb['2']
"['255','255','255']"

该应用程序很丰富,但是对于每个关系(rgb2labelrgb2strstr2rgbstr2label等)都需要一个唯一的唯一字典。

是否存在一种具有相同易用性的紧凑型解决方案?

1 个答案:

答案 0 :(得分:1)

在这里,您将自己限制为一对一的词典,因此最终会加载大量词典(此处为4 ^ 2 = 16)。

您可以改用一对多词典,因此只有4个:

for row in csv.reader(csv_file):
    rgb[row[1]] = row
    label[row[2]] = row

您将这样使用:

>>> rgb[ "['255','255','255']"][2]
'2'
>>> label['2'][1]
"['255','255','255']"

您也可以通过将行变成dict来使其更清晰:

for row in csv.reader(csv_file):
    name, rgb, label, color = row
    d = {"rgb": rgb, "label": label}
    rgb[row[1]] = d
    label[row[2]] = d

您将这样使用:

>>> rgb[ "['255','255','255']"]["label"]
'2'
>>> label['2']["rgb"]
"['255','255','255']"