Question

我有一个熊猫系列。基本上是一个特定的pandas数据行。

Name: NY.GDP.PCAP.KD.ZG, dtype: int64
NY.GDP.DEFL.ZS_logdiff       0.341671
NY.GDP.DISC.CN               0.078261
NY.GDP.DISC.KN               0.083890
NY.GDP.FRST.RT.ZS            0.296574
NY.GDP.MINR.RT.ZS            0.264811
NY.GDP.MKTP.CD_logdiff       0.522725
NY.GDP.MKTP.CN_logdiff       0.884601
NY.GDP.MKTP.KD_logdiff       0.990679
NY.GDP.MKTP.KD.ZG            0.992603
NY.GDP.MKTP.KN_logdiff      -0.077253
NY.GDP.MKTP.PP.CD_logDiff    0.856861
NY.GDP.MKTP.PP.KD_logdiff    0.990679
NY.GDP.NGAS.RT.ZS           -0.018126
NY.GDP.PCAP.CD_logdiff       0.523433
NY.GDP.PCAP.KD.ZG            1.000000
NY.GDP.PCAP.KN_logdiff       0.999456
NY.GDP.PCAP.PP.CD_logdff     0.857321
NY.GDP.PCAP.PP.KD_logdiff    0.999456

第一列是您在系列中找到的索引。现在我想基本上在列表中获取所有这些索引名称，以便只有那些索引应该来自右列中的绝对值小于0.5。为了给出一个上下文，这个序列基本上是一个对应于相关矩阵中的变量NY.GDP.PCAP.KD.ZG的行，我想保留这个变量以及与该变量具有相关性小于0.5的那些变量。休息变量我将从数据框中删除

目前我做了类似的事情，但它也保留了NaN

print(tourism[columns].corr().ix[14].where(np.absolute(tourism[columns].corr().ix[14]<0.5)))

其中tourism是数据框，列是我在其中进行相关性分析的列集，14是与上述列对应的相关矩阵中的行

给出：

NY.GDP.DEFL.ZS_logdiff       0.341671
NY.GDP.DISC.CN               0.078261
NY.GDP.DISC.KN               0.083890
NY.GDP.FRST.RT.ZS            0.296574
NY.GDP.MINR.RT.ZS            0.264811
NY.GDP.MKTP.CD_logdiff            NaN
NY.GDP.MKTP.CN_logdiff            NaN
NY.GDP.MKTP.KD_logdiff            NaN
NY.GDP.MKTP.KD.ZG                 NaN
NY.GDP.MKTP.KN_logdiff      -0.077253
NY.GDP.MKTP.PP.CD_logDiff         NaN
NY.GDP.MKTP.PP.KD_logdiff         NaN
NY.GDP.NGAS.RT.ZS           -0.018126
NY.GDP.PCAP.CD_logdiff            NaN
NY.GDP.PCAP.KD.ZG                 NaN
NY.GDP.PCAP.KN_logdiff            NaN
NY.GDP.PCAP.PP.CD_logdff          NaN
NY.GDP.PCAP.PP.KD_logdiff         NaN
Name: NY.GDP.PCAP.KD.ZG, dtype: float64

Answer 1

如果x是你的系列，那么：

x[x.abs() < 0.5].index

设置熊猫系列

1 个答案: