执行字符串功能使用l-或s-或应用AND导出为带R的CSV

时间:2015-10-11 20:57:23

标签: r csv data.table

数据:

dt <- data.table(uid = c("abc001", "abc002", "abc003"..."abc100"), 
                 coords=("36.8 x 108", "55.5 x -4.6", "37.2 x -84.0"..."55.5 x -4.6"))

注意:任何坐标集都可能与多个用户ID相关联。在这个例子中,dt将有100个唯一的uid,但是&lt; 100套独特的坐标。

目标:按坐标汇总数据,以便每个唯一的坐标集与一组用户ID相关联。那就是:

coords                  uid
36.8 x 108              abc001
55.5 x -4.6             abc002, abc100
37.2 x -84.0            abc003

我将如何完成此任务?与我发现的聚合技术相关的函数涉及对数据执行数学运算。例如,如果uid信息实际上是坐标的温度记录,我可以在data.table的j变量中轻松使用lapply,然后按coords分组。事实上,我 在j术语中使用了lapply和list(),这产生了一个似乎满足我需要的data.table。不幸的是,多个uid被保存为列表,这种类型在与write.csv或ff包一起使用时会抛出错误。

我甚至探索过使用'unlist'的一些变体。然而,在这一点上,维持uid和coords之间的关联成为一个问题。

最后,在使用简单排序和几个if语句将未分组数据写入csv文件后,我在Calc中生成了所需的结果。它只能起作用,因为数据集很小。

思想?

0 个答案:

没有答案