使用pdfCluster分析密度模式

时间:2016-06-13 20:03:04

标签: r

所以我试图分析一个正方形并将某些群体的所有点聚集在一起。我认为pdfCluster是最好的方法,因为我需要通过内核密度估算器来测量点的密度以获得正确的簇,然后我需要实际将它们组合在一起以创建一个图(我有点的长/纬度)。我真的坚持这一点,任何帮助将不胜感激。

在尝试使用内核密度估算器来聚类点时,我遇到了代码问题。我正在以两种不同的方式处理我的数据,试图找到最优的数据。首先,我以矩阵的形式提供数据。下面是一个例子,我的代码中的纬度和经度附加到矩阵中的列和行。

m <- c(
  c(8.83,8.89,8.81,8.87,8.9,8.87),
  c(8.89,8.94,8.85,8.94,8.96,8.92),
  c(8.84,8.9,8.82,8.92,8.93,8.91),
  c(8.79,8.85,8.79,8.9,8.94,8.92),
  c(8.79,8.88,8.81,8.9,8.95,8.92),
  c(8.8,8.82,8.78,8.91,8.94,8.92),
  c(8.75,8.78,8.77,8.91,8.95,8.92),
  c(8.8,8.8,8.77,8.91,8.95,8.94),
  c(8.74,8.81,8.76,8.93,8.98,8.99),
  c(8.89,8.99,8.92,9.1,9.13,9.11),
  c(8.97,8.97,8.91,9.09,9.11,9.11),
  c(9.04,9.08,9.05,9.25,9.28,9.27),
  c(9,9.01,9,9.2,9.23,9.2),
  c(8.99,8.99,8.98,9.18,9.2,9.19),
  c(8.93,8.97,8.97,9.18,9.2,9.18)
)
dim(m) <- c(15,6)

我的数据也在数据表中,其中第1列是我的纬度,第2列是我的经度,第3列是值。

z <- c(
  c(8.83,8.89, 2),
  c(8.89,8.94, 4),
  c(8.84,8.9, 1),
  c(8.79,8.852, 4),
  c(8.79,8.88, 5),
  c(8.8,8.82, 2),
  c(8.75,8.78, 1),
  c(8.8,8.8, 2),
  c(8.74,8.81, 7),
  c(8.89,8.99, 1),
  c(8.97,8.97, 6),
  c(9.04,9.08, 8),
  c(9,9.01, 1),
  c(8.99,8.99, 8),
  c(8.93,8.97, 2)
)
dim(z) <- c(15,3)

我使用的实际数据来自较大的栅格和shapefile。 栅格来自http://beta.sedac.ciesin.columbia.edu/data/set/gpw-v4-population-count/data-download。 shapefile来自http://www.gadm.org/download - 我正在使用尼日利亚。

这篇文章的主要问题是聚类和聚类功能的最佳数据格式。我目前拥有整个国家的所有网格点(Lat,Long,Value)。我想在所有点上运行核密度估计器,然后根据某些值进行聚类。看看pdfCluster包它似乎只是这样做,除了我不确定如何允许它接受(纬度/经度)值并在地理平面上运行。由于我的数据跨越某个地理区域并且不是完全连续的,因此我遇到了错误。有关如何修改pdfCluster包以接受此类值或最适合使用哪些数据集的任何提示将不胜感激。

0 个答案:

没有答案