聚合和绑定功能的说明

时间:2018-09-21 11:07:12

标签: r

首先,我无法理解聚合函数和cbind,我需要解释非常简单的单词,其次,我有数据

permno number         mean        std
1   10107    120 0.0117174000 0.06802718
2   11850    120 0.0024398083 0.04594591
3   12060    120 0.0005072167 0.08544500
4   12490    120 0.0063569167 0.05325215
5   14593    120 0.0200060583 0.08865493
6   19561    120 0.0154743500 0.07771348
7   25785    120 0.0184815583 0.16510082
8   27983    120 0.0025951333 0.09538822
9   55976    120 0.0092889000 0.04812975
10  59328    120 0.0098526167 0.07135423

我需要通过

处理
data_processed2 <- aggregate(cbind(return)~permno, Data_summary, median)

我无法理解此命令,请向我解释非常简单,谢谢!

1 个答案:

答案 0 :(得分:0)

<?php $date = $start; while(strtotime($date) <= strtotime($end)) { $day_num = date('d', strtotime($date)); $day_name = date('l', strtotime($date)); $date = date("Y-m-d", strtotime("+1 day", strtotime($date))); echo "<td class='$day_num $day_name'><input type='checkbox' class='uk-checkbox'></td>"; }; ?> 将两个或多个表(数据框)并排放置,然后将它们组合成一个大表。因此,例如,如果您有一个表包含A,B和C列,而另一个表包含D和E列,则在cbind之后,您将有一个包含五列的表:A,B,C,对于行的D和E,cbind假定所有表的顺序相同。 正如Rui所指出的那样,在您的示例中cbind不会执行任何操作,因为cbind不是表,即使它是表,也只是一件事。

return生成一个表,将其除以某个变量,然后计算每个组中一个变量的统计信息。例如,如果我有按月和月中某一天的销售数据,则可以按月进行汇总,并计算每个月的每日平均销售量。

您提供的命令使用以下语法:

aggregate

变量(aggregate(VARIABLES~GROUPING, DATA, FUNCTION) -没什么意义)是要为其计算统计信息的所有变量的列表 分组(cbind(return))是一个变量,通过它您可以将数据分为几组(在示例数据中,您提供的每一行对此变量都有唯一的编号,因此也没有任何意义)。 数据是您正在使用的数据框。 函数是中位数。

因此,此调用会将Data_summery分为pernmo相同的组,并计算每列的中位数。

使用您提供的数据,基本上可以得到相同的表,因为您将数据按每行一组进行分组...-实际上,由于您的变量是一个空组,因此我可以告诉你,你什么也得不到。