我正在按文件夹读取数据,然后按日期范围提取数据。
我希望按列汇总我的数据,但这样做并不是要合并它们以减少行数。
我正在使用以下代码
temptable <- temptable[ ,lapply(.SD, sum), by = .(INV_ITEM_ID),
.SDcols = c("Ext Sale", "Ext Total Cost")]
我已经对数据的子集进行了此操作,它可以使它工作,但不能用于完整的数据集。
关于为什么不能正确总结的任何想法?我会提供一个可复制的示例,但是代码似乎可以解决这个问题。
如果需要,我可以提供其他详细信息。
正在发生的事情的一个例子是我们有以下情况
INV_ITEM_ID, Ext Sale, Ext Total Cost
1234 8 4
1234 2 7
1233 6 4
当我运行上面的代码时,它就是返回我的方式,而不是像下面那样返回
INV_ITEM_ID, Ext Sale, Ext Total Cost
1234 10 11
1233 6 4