Question

我有一个约700行和3列的CSV文件，其中包含label，rgb和string信息，例如：

str;      rgb;                   label;         color
bones;    "['255','255','255']"; 2;             (241,214,145)
Aorta;    "['255','0','0']";     17;            (216,101,79)
VenaCava; "['0','0','255']";     16;            (0,151,206)

我想创建一种简单的方法，将一个唯一的输入转换为一个唯一的输出。

一种解决方案是将所有ROIDisplayColor条目与相应的标签条目作为字典进行哈希处理，例如rgb2label：

with open("c:\my_file.csv") as csv_file:
    rgb2label, label2rgb = {}, {} # rgb2str, label2str, str2label...
    for row in csv.reader(csv_file):
        rgb2label[row[1]] = row[2]
        label2rgb[row[2]] = row[1]

这可以简单地如下使用：

>>> rgb2label[ "['255','255','255']"]
'2'
>>> label2rgb['2']
"['255','255','255']"

该应用程序很丰富，但是对于每个关系（rgb2label，rgb2str，str2rgb，str2label等）都需要一个唯一的唯一字典。

是否存在一种具有相同易用性的紧凑型解决方案？

Answer 1

在这里，您将自己限制为一对一的词典，因此最终会加载大量词典（此处为4 ^ 2 = 16）。

您可以改用一对多词典，因此只有4个：

for row in csv.reader(csv_file):
    rgb[row[1]] = row
    label[row[2]] = row

您将这样使用：

>>> rgb[ "['255','255','255']"][2]
'2'
>>> label['2'][1]
"['255','255','255']"

您也可以通过将行变成dict来使其更清晰：

for row in csv.reader(csv_file):
    name, rgb, label, color = row
    d = {"rgb": rgb, "label": label}
    rgb[row[1]] = d
    label[row[2]] = d

您将这样使用：

>>> rgb[ "['255','255','255']"]["label"]
'2'
>>> label['2']["rgb"]
"['255','255','255']"

简化Python中多个哈希的使用

1 个答案: