当您尝试对数据进行子集时,我想知道大型数据集是否存在巨大的性能差异/影响。
在我的场景中,我的数据帧只有不到29,000条记录/数据。
当我不得不对数据进行分组时,我想到了两种方法。
使用被动方式从csv文件中读取数据。
选项1
long_lat_df <- reactive({
long_lat <- subset(readFile(), select=c(Latitude..deg.,Longitude..deg.))
return(long_lat)
})
选项2 我想到的是提取2列并将2列分配给它自己的变量long和lat。从那里我可以组合2列来形成一个新的数据框,我可以用它来处理空间分析。
这两个选项之间是否会产生潜在的性能影响?