如何在Orange中使用“分组依据”。也就是说,我可以对表值进行“分组依据”吗?

时间:2019-02-22 00:25:24

标签: orange

关于Orange Data Science平台 我找不到用于数据表上聚合函数的任何方法。也就是说,我想对数据集中给定分类值的数字求和(例如,特定花的多少个实例)。 有什么方法可以不借助python脚本来做到这一点? 谢谢。

1 个答案:

答案 0 :(得分:0)

除了python脚本外,我在UI中还没有找到其他方法来执行此操作-但想鼓励您考虑使用脚本,因为使用pandas并不需要太多:

import pandas as pd
from Orange.data.pandas_compat import table_from_frame

#read file into Orange
newData = pd.read_csv('yourfile.tab', sep=chr(0x09))

#group data on categories in 'column'
grouped = newData.groupby('column')

#calculate the sum from the grouping, convert to Orange table and set to out_data
out_data = table_from_frame(grouped.sum())

优点: 提供了许多加载/操作数据的可能性

缺点: 该方法仅适用于使用python加载文件,因为我尚未确定如何将Orange表更改为熊猫数据框,以便可以使用in_data代替。