无法在R中正确汇总数据

时间:2018-07-11 16:20:32

标签: r data.table lapply

我正在按文件夹读取数据,然后按日期范围提取数据。

我希望按列汇总我的数据,但这样做并不是要合并它们以减少行数。

我正在使用以下代码

 temptable <- temptable[ ,lapply(.SD, sum), by = .(INV_ITEM_ID),
                         .SDcols = c("Ext Sale", "Ext Total Cost")]

我已经对数据的子集进行了此操作,它可以使它工作,但不能用于完整的数据集。

关于为什么不能正确总结的任何想法?我会提供一个可复制的示例,但是代码似乎可以解决这个问题。

如果需要,我可以提供其他详细信息。

正在发生的事情的一个例子是我们有以下情况

INV_ITEM_ID, Ext Sale, Ext Total Cost
1234           8             4
1234           2             7
1233           6             4

当我运行上面的代码时,它就是返回我的方式,而不是像下面那样返回

INV_ITEM_ID, Ext Sale, Ext Total Cost
1234           10            11
1233           6             4

0 个答案:

没有答案