没有值的熊猫多索引

时间:2020-07-29 00:53:02

标签: python pandas

我正在使用MultiIndex,数据来自数据库。我想用作键的某些值为空。我发现这导致数据被省略。例如

import numpy as np
import pandas as pd
import sys

print(sys.version)  # 3.7.3
print(pd.__version__) # 1.0.3
idx = pd.MultiIndex.from_tuples([('A', 'a'), ('A', 'b'), ('B', 'a'), ('B', ' '), ('C', 'a'), ('C', None), ('D', '')], names=['Level 1', 'Level 2'])
print(idx)
d = {'X':{('A','a'):1, ('A','b'):2, ('B','a'):3, ('B',' '):4, ('C','a'): 5, ('C',None): 6, ('D',''):7},
'Y':{('A','a'):1, ('C',None): 6, ('D',''):7}
}
df = pd.DataFrame(data=d, index=idx)
print(df)

结果是:

MultiIndex([('A', 'a'),
            ('A', 'b'),
            ('B', 'a'),
            ('B', ' '),
            ('C', 'a'),
            ('C', nan),
            ('D',  '')],
           names=['Level 1', 'Level 2'])
                   X    Y
Level 1 Level 2
A       a        1.0  1.0
        b        2.0  NaN
B       a        3.0  NaN
                 4.0  NaN
C       a        5.0  NaN
        NaN      NaN  NaN
D                7.0  7.0

我的问题是C / None行,它给了我NaN而不是6。其他空白值(空字符串,空格)没有这种行为。

这是预期的还是我需要以某种方式配置MultiIndex?

1 个答案:

答案 0 :(得分:2)

当索引中包含NaN时,这是不安全的:github1 github2

为进行简单修复,您可以将数据加载到数据框,然后再<a href="javascript:void(0)" @click="stopProcess">here</a>fillna加载