标签: python pandas numpy scipy zipf
我想根据zipf分布/低功率/长尾巴来替换缺少的值。例如,我有一个包含10列的数据集(5列分类数据和5列数字数据)。我想替换基于zipf法则分类的5列上的一些数据点,左侧的列比右侧的列丢失更多。
我使用Python来完成此任务。
我在以下链接中看到了有关zipf分布的Scipy手册:https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.random.zipf.html,但仍然对我没有多大帮助。