应用错误收集

当您尝试对数据进行子集时，我想知道大型数据集是否存在巨大的性能差异/影响。

在我的场景中，我的数据帧只有不到29,000条记录/数据。

当我不得不对数据进行分组时，我想到了两种方法。

使用被动方式从csv文件中读取数据。

选项1

long_lat_df <- reactive({
  long_lat <- subset(readFile(), select=c(Latitude..deg.,Longitude..deg.))
  return(long_lat)
})

选项2 我想到的是提取2列并将2列分配给它自己的变量long和lat。从那里我可以组合2列来形成一个新的数据框，我可以用它来处理空间分析。

这两个选项之间是否会产生潜在的性能影响？