我有一个约700行和3列的CSV文件,其中包含label
,rgb
和string
信息,例如:
str; rgb; label; color
bones; "['255','255','255']"; 2; (241,214,145)
Aorta; "['255','0','0']"; 17; (216,101,79)
VenaCava; "['0','0','255']"; 16; (0,151,206)
我想创建一种简单的方法,将一个唯一的输入转换为一个唯一的输出。
一种解决方案是将所有ROIDisplayColor条目与相应的标签条目作为字典进行哈希处理,例如rgb2label
:
with open("c:\my_file.csv") as csv_file:
rgb2label, label2rgb = {}, {} # rgb2str, label2str, str2label...
for row in csv.reader(csv_file):
rgb2label[row[1]] = row[2]
label2rgb[row[2]] = row[1]
这可以简单地如下使用:
>>> rgb2label[ "['255','255','255']"]
'2'
>>> label2rgb['2']
"['255','255','255']"
该应用程序很丰富,但是对于每个关系(rgb2label
,rgb2str
,str2rgb
,str2label
等)都需要一个唯一的唯一字典。
是否存在一种具有相同易用性的紧凑型解决方案?
答案 0 :(得分:1)
在这里,您将自己限制为一对一的词典,因此最终会加载大量词典(此处为4 ^ 2 = 16)。
您可以改用一对多词典,因此只有4个:
for row in csv.reader(csv_file):
rgb[row[1]] = row
label[row[2]] = row
您将这样使用:
>>> rgb[ "['255','255','255']"][2]
'2'
>>> label['2'][1]
"['255','255','255']"
您也可以通过将行变成dict
来使其更清晰:
for row in csv.reader(csv_file):
name, rgb, label, color = row
d = {"rgb": rgb, "label": label}
rgb[row[1]] = d
label[row[2]] = d
您将这样使用:
>>> rgb[ "['255','255','255']"]["label"]
'2'
>>> label['2']["rgb"]
"['255','255','255']"