我有大约3列和600000行的大数据集。旋转后,它将转换为1000列和600行 输入数据的子集
Date Id Price
2014/12/03 Id1 100
2014/12/03 Id2 120
2014/12/03 Id3 110
2014/12/03 Id4 105
2014/12/02 Id1 150
2014/12/02 Id2 115
2014/12/02 Id3 140
2014/12/02 Id4 135
2014/12/01 Id1 165
2014/12/01 Id2 155
2014/12/01 Id3 185
2014/12/01 Id4 195
2014/11/30 Id1 160
2014/11/30 Id2 170
2014/11/30 Id3 180
2014/11/30 Id4 190
旋转后输出数据
Date Id1 Id2 Id3 Id4
2014/12/03 100 120 110 105
2014/12/02 150 115 140 135
2014/12/01 165 155 185 195
2014/11/30 160 170 180 190
由于数据集会很大,性能效率会更高吗?
1.转入SQL并返回R
2.将原始数据集返回到R并在R
我正在使用RODBC从MSSQL服务器获取数据。有关于此的任何建议吗?
答案 0 :(得分:0)
我认为这样可以提高效率"在你的情况下没有很好的定义。如果不知道机器的规格以及运行MSSQL的环境的更多细节,就不可能知道哪个更快。
很可能你的SQL环境比R更有效地设置来处理操作,假设配置原始数据库的人知道他们在做什么。
所以,假设一切都相对平等,那么在你把它变成R之前就去做。