每列分成10个箱

时间:2015-05-29 06:11:00

标签: python numpy pandas

我正在尝试为数据框中的每个列创建10个bin的binning。输入将是一个csv文件,对于每个列为10的列,输出应为JSON。

给定一个输入文件,输出应该在百分位数(1,5,10,25,50,75,90,95,99)的帮助下显示每列的分箱值

这是我到目前为止的代码。

import pandas as pd

df = pd.read_csv('train.csv')


def func(column):
    return pd.cut(column, bins=10)


a = df.apply(func, axis=1)

print(a)

请对此有所了解。感谢

2 个答案:

答案 0 :(得分:0)

嗯,不确定我是否完全理解你的问题,但也许你想要axis=0而不是axis=1axis=1是行)。

答案 1 :(得分:0)

也许问题是旧问题并不清楚,但Binning是一些学习python的人的重要课题,所以我更喜欢在这里添加这些反馈:

我在本文中找到了一个很好的binning示例: 见#10 – Cut function for binning