关于Orange Data Science平台 我找不到用于数据表上聚合函数的任何方法。也就是说,我想对数据集中给定分类值的数字求和(例如,特定花的多少个实例)。 有什么方法可以不借助python脚本来做到这一点? 谢谢。
答案 0 :(得分:0)
除了python脚本外,我在UI中还没有找到其他方法来执行此操作-但想鼓励您考虑使用脚本,因为使用pandas并不需要太多:
import pandas as pd
from Orange.data.pandas_compat import table_from_frame
#read file into Orange
newData = pd.read_csv('yourfile.tab', sep=chr(0x09))
#group data on categories in 'column'
grouped = newData.groupby('column')
#calculate the sum from the grouping, convert to Orange table and set to out_data
out_data = table_from_frame(grouped.sum())
优点: 提供了许多加载/操作数据的可能性
缺点: 该方法仅适用于使用python加载文件,因为我尚未确定如何将Orange表更改为熊猫数据框,以便可以使用in_data代替。