我正在尝试map
系列的某些值,同时保持其他值不变。在这种情况下,我要更改dmso --> dmso-2
,naoh --> naoh-2
和water --> water-2
,但我得到的是KeyError
。
首先,我正在做一个布尔语句,看看它是否是任何感兴趣的,如果True
然后使用这个字典,如果False
然后只返回x
。我可以手动进入并更改它们,但编程很有趣,我无法弄清楚为什么这个逻辑不起作用。
# A sample of the series
Se_data = pd.Series({
'DMSO_S43': 'dmso',
'DMSO_S44': 'dmso',
'DOXYCYCLINE-HYCLATE_S25': 'doxycycline-hyclate',
'DOXYCYCLINE-HYCLATE_S26': 'doxycycline-hyclate'
})
# This boolean works
Se_data.map(lambda x: x in {"dmso", "naoh", "water"})
# DMSO_S43 True
# DMSO_S44 True
# DOXYCYCLINE-HYCLATE_S25 False
# DOXYCYCLINE-HYCLATE_S26 False
# This dictionary on the boolean works
Se_data.map(lambda x: {True: "control", False: x}[x in {"dmso", "naoh", "water"}])
# DMSO_S43 control
# DMSO_S44 control
# DOXYCYCLINE-HYCLATE_S25 doxycycline-hyclate
# DOXYCYCLINE-HYCLATE_S26 doxycycline-hyclate
# This nested dictionary isn't working
Se_data.map(lambda x: {
True: {"dmso": "dmso-2", "naoh": "naoh-2", "water": "water-2"}[x],
False: x
}[x in {"dmso", "naoh", "water"}])
# KeyError: 'doxycycline-hyclate'
答案 0 :(得分:1)
如果我理解正确,你可以做到
Se_data.replace({
'dmso': 'dmso-2',
'naoh': 'naoh-2',
'water': 'water-2',
})
将保留所有其他值。
对于它的价值,你的代码因为表达式
而无效{"dmso": "dmso-2", "naoh": "naoh-2", "water": "water-2"}[x]
评估所有 x
,而不只是x in {"dmso", "naoh", "water"}
。 Python词典中的值不会像您预期的那样被短路或评估。你可以做类似
Se_data.map(lambda x: {
"dmso": "dmso-2",
"naoh": "naoh-2",
"water": "water-2"
}[x] if x in {"dmso", "naoh", "water"} else x)
或
Se_data.map(lambda x: {
"dmso": "dmso-2",
"naoh": "naoh-2",
"water": "water-2"
}.get(x, x))