我在printk
中存储了大量数据。指数是单调的,但不是连续的。我正在尝试对数据的直方图进行一些分析,因此我创建了以下结构:
vals
这是从实验仪器中获取的数据,我知道其中一些hist = pd.DataFrame(vals)
hist['bins'] = pd.cut(vals, 100)
只有1或2个计数,我正试图删除。我尝试使用bins
,如下所示并得到以下错误(注释末尾包含完整的回溯):
groupby
但是,当我执行以下操作时,错误不会显示,我得到了预期的结果:
hist.groupby('bins').describe()
AttributeError: 'Categorical' object has no attribute 'flags'
如果我不包含第二行In[]: hist.index = hist.bins
In[]: hist['bins'] = hist.index
In[]: desc = hist.groupby('bins').describe()
In[]: desc.index.names = ['bins', 'describe']
Out[]: **describe with MultiIndex for rows.**
,我仍然会得到一个hist['bins'] = hist.index
并且我能说的最好,追溯是相同的。
有人可以解释AttributeError: 'Categorical' object has no attribute 'flags'
是什么以及当我将flags
设置为index
然后将bins
替换为存储在bins
?
我的最终目标是删除数量为< = 6的垃圾箱数据。如果某人的解决方法比我追求的方式更容易,我也很感激。
index