如何使用带有.map的嵌套字典作为Pandas系列? pd.Series([])。地图

时间:2017-07-19 00:22:21

标签: python pandas dictionary vector mapping

我正在尝试map系列的某些值,同时保持其他值不变。在这种情况下,我要更改dmso --> dmso-2naoh --> naoh-2water --> water-2,但我得到的是KeyError

首先,我正在做一个布尔语句,看看它是否是任何感兴趣的,如果True然后使用这个字典,如果False然后只返回x。我可以手动进入并更改它们,但编程很有趣,我无法弄清楚为什么这个逻辑不起作用。

# A sample of the series
Se_data = pd.Series({
    'DMSO_S43': 'dmso',
    'DMSO_S44': 'dmso',
    'DOXYCYCLINE-HYCLATE_S25': 'doxycycline-hyclate',
    'DOXYCYCLINE-HYCLATE_S26': 'doxycycline-hyclate'
})

# This boolean works
Se_data.map(lambda x: x in {"dmso", "naoh", "water"})
# DMSO_S43                          True
# DMSO_S44                          True
# DOXYCYCLINE-HYCLATE_S25          False
# DOXYCYCLINE-HYCLATE_S26          False

# This dictionary on the boolean works
Se_data.map(lambda x: {True: "control", False: x}[x in {"dmso", "naoh", "water"}])
# DMSO_S43                                           control
# DMSO_S44                                           control
# DOXYCYCLINE-HYCLATE_S25                doxycycline-hyclate
# DOXYCYCLINE-HYCLATE_S26                doxycycline-hyclate

# This nested dictionary isn't working
Se_data.map(lambda x: {
    True: {"dmso": "dmso-2", "naoh": "naoh-2", "water": "water-2"}[x],
    False: x
}[x in {"dmso", "naoh", "water"}])
# KeyError: 'doxycycline-hyclate'

1 个答案:

答案 0 :(得分:1)

如果我理解正确,你可以做到

Se_data.replace({
    'dmso': 'dmso-2',
    'naoh': 'naoh-2',
    'water': 'water-2',
})

将保留所有其他值。

对于它的价值,你的代码因为表达式

而无效
{"dmso": "dmso-2", "naoh": "naoh-2", "water": "water-2"}[x]

评估所有 x,而不只是x in {"dmso", "naoh", "water"}。 Python词典中的值不会像您预期的那样被短路或评估。你可以做类似

的事情
Se_data.map(lambda x: {
    "dmso": "dmso-2",
    "naoh": "naoh-2",
    "water": "water-2"
}[x] if x in {"dmso", "naoh", "water"} else x)

Se_data.map(lambda x: {
    "dmso": "dmso-2",
    "naoh": "naoh-2",
    "water": "water-2"
}.get(x, x))