熊猫修改数据框后引发错误

时间:2019-03-06 11:23:51

标签: python pandas

使用熊猫时出现一个奇怪的错误。

我有一个对数据进行分类和排序的功能。这完全正常。 但是,当我尝试对数据框进行子集化时,虽然数据框看起来相同,但它不再起作用。

引发错误的代码:

idxsort = dataframe[header].value_counts().sort_index()
bins = np.round(len(idxsort) / 10)
if bins < 10:
     bins = 10
gsort = idxsort.groupby(pd.cut(idxsort.index, bins=bins))
distribution = gsort.describe()['count']

这完全适用于完整的数据帧,但是当我像这样修改它时:

samples =  [4033, 4085, 4080, 4060, 4026, 4082, 4096, 4100, 4103, 4105, 4121]
dataframe = dataframe.set_index(dataframe.columns[0])
dataframe = dataframe.loc[samples, :]
dataframe = dataframe.reset_index()

并通过不再起作用的相同代码运行它。

这是怎么回事?

编辑:错误为“ ValueError:无法剪切空数组”

1 个答案:

答案 0 :(得分:0)

解决了!通过对我的数据集进行子集设置,我确实会产生一些只有Na值的列。

我通过添加以下内容来修复它:dataframe.dropna(how='all', axis=1)