Question

我想在pandas.DataFrame中选择包含大于1000行的所有值的列：

In [87]: X_NAN = X[X>1000]
In [88]: X_NAN.head()

Out[88]: VAR_0002   VAR_0003    VAR_0004    VAR_0005
           NaN        NaN         10000        NaN

然后我想从NaN值中清除X_NAN并创建新的data.Frame：

In [89]: X_with_big_1000 = X_NAN.dropna(axis=1)
         X_with_big_1000.head()

Out[89]: VAR_0004   VAR_0006    VAR_0007    VAR_0008
           10000     22000       18000       21000

但是我知道并且我检查它 - 当我调用dropna方法时，他删除了值，这不应该。我尝试how=Any和how=All - 没有帮助。

示例：

In [92]: X_NAN.VAR_0100

Out[92]: ID
         1       100000
         2       200000
         3       300000
         4       400000
Name: VAR_0100, dtype: float64

错误：

In [93]: X_with_big_1000.VAR_0100

---------------------------------------------------------------------------
AttributeError: 'DataFrame' object has no attribute 'VAR_0100'

有什么建议吗？可能我应该改变我的定义选择列的方式吗？

大熊猫中的Dropna列

0 个答案: