我有一个非常大的数据集(约250,000条记录),我用它来创建一个线性模型。我绘制了预测与实际的对比
。
我尝试使用identify()来选择靠近图形中心的两个值集合,并使用coord()来识别它们。这里有一些问题:1)这些集群中有很多很多点比我单独点击和识别,2)我需要知道所有这些点,选择所有这些点而不选择任何其他点,并将我的数据子集到这些点。
该模型是使用与辅助空间数据配对的卫星图像创建的。表中的每个条目对应于地图上的特定点。我需要确定这两个集群在地图上的位置。我的数据框包括FID(我可以用它链接回地图),原始预测器,响应和我的预测值。
我感谢任何帮助!