我目前正在尝试构建具有大型数据集的双变量密度模型。 (矩阵大小 - 400000+行2列,矩阵中有很多重复)
样本数据
X Y
531203.5 182832.1
525208.1 179391.9
532985.8 182001.6
530437.8 182912.0
528051.0 178742.0
528858.4 181542.9
我知道包'ks'及其函数'kde',但它只适用于少于1000行的数据大小,计算我的数据需要很长时间(30分钟+)
我应该研究诸如雪之类的多线程包吗? (我正在使用笔记本电脑)
任何提示和建议都将不胜感激!
安德鲁