我想在pandas.DataFrame
中选择包含大于1000行的所有值的列:
In [87]: X_NAN = X[X>1000]
In [88]: X_NAN.head()
Out[88]: VAR_0002 VAR_0003 VAR_0004 VAR_0005
NaN NaN 10000 NaN
然后我想从NaN值中清除X_NAN
并创建新的data.Frame
:
In [89]: X_with_big_1000 = X_NAN.dropna(axis=1)
X_with_big_1000.head()
Out[89]: VAR_0004 VAR_0006 VAR_0007 VAR_0008
10000 22000 18000 21000
但是我知道并且我检查它 - 当我调用dropna
方法时,他删除了值,这不应该。我尝试how=Any
和how=All
- 没有帮助。
示例:
In [92]: X_NAN.VAR_0100
Out[92]: ID
1 100000
2 200000
3 300000
4 400000
Name: VAR_0100, dtype: float64
错误:
In [93]: X_with_big_1000.VAR_0100
---------------------------------------------------------------------------
AttributeError: 'DataFrame' object has no attribute 'VAR_0100'
有什么建议吗?可能我应该改变我的定义选择列的方式吗?