我使用scipy
创建了几个等均值分箱的例子,但我想知道是否可以使用库进行等宽或深度分级。
实际上,我很好地使用其他库,而不仅仅是scipy
答案 0 :(得分:0)
我无法抗拒为此目的试用RapidMiner。我用这个脚本创建了一组随机的高斯偏差。
>>> import random
>>> with open('gaussian.txt', 'w') as gaussian:
... for n in range(100):
... _ = gaussian.write(str(random.gauss(0,1))+'\n')
我使用的是RapidMiner Studio的免费版本。
我按照Add Data
按钮加载了数据。然后我在'Process'窗格中设计了'我的计算,就像这样。
要实现此目的,您可以从顶部附近的左窗格中拖放“检索高斯”数据集,并从左下窗格中拖放“离散”。我发现搜索表单使用“binning”作为搜索词很容易找到后一项。
我为'Discretize'设置'bins'的大小,并将两个组件相互连接,并将'res'设为'输出'。
结果包括此信息。
答案 1 :(得分:-1)
不要指望一切都需要图书馆。
如果你仔细考虑它们,可以在1或2行Python代码中实现这两种爆炸。找到/安装/学习图书馆可能需要更长的时间,而不是自己编写这段代码。