根据ZIPF分布在数据集上生成NaN值

时间:2019-10-15 22:37:07

标签: python pandas numpy scipy zipf

我想根据zipf分布/低功率/长尾巴来替换缺少的值。例如,我有一个包含10列的数据集(5列分类数据和5列数字数据)。我想替换基于zipf法则分类的5列上的一些数据点,左侧的列比右侧的列丢失更多。

我使用Python来完成此任务。

我在以下链接中看到了有关zipf分布的Scipy手册:https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.random.zipf.html,但仍然对我没有多大帮助。

0 个答案:

没有答案