使用scipy进行等宽和等深度分级

时间:2017-10-03 11:42:20

标签: python scipy data-mining binning

我使用scipy创建了几个等均值分箱的例子,但我想知道是否可以使用库进行等宽或深度分级。

实际上,我很好地使用其他库,而不仅仅是scipy

2 个答案:

答案 0 :(得分:0)

我无法抗拒为此目的试用RapidMiner。我用这个脚本创建了一组随机的高斯偏差。

>>> import random
>>> with open('gaussian.txt', 'w') as gaussian:
...     for n in range(100):
...         _ = gaussian.write(str(random.gauss(0,1))+'\n')

我使用的是RapidMiner Studio的免费版本。

我按照Add Data按钮加载了数据。然后我在'Process'窗格中设计了'我的计算,就像这样。

design

要实现此目的,您可以从顶部附近的左窗格中拖放“检索高斯”数据集,并从左下窗格中拖放“离散”。我发现搜索表单使用“binning”作为搜索词很容易找到后一项。

我为'Discretize'设置'bins'的大小,并将两个组件相互连接,并将'res'设为'输出'。

结果包括此信息。

binning

答案 1 :(得分:-1)

不要指望一切都需要图书馆。

如果你仔细考虑它们,可以在1或2行Python代码中实现这两种爆炸。找到/安装/学习图书馆可能需要更长的时间,而不是自己编写这段代码。