解释phom R包 - 持久同源性 - 数据拓扑分析 - 聚类分析

时间:2014-03-28 03:11:24

标签: r cluster-analysis topology

我正在学习用R的pHom包来分析数据的拓扑结构。

我想理解(表征)一组数据(A Matrix(3500行,10列)。为了实现这样的目标,R-package phom运行描述数据的持久同源性测试。

(参考:以下视频描述了我们在拓扑中寻求同源性的方法 - 参考视频4分钟:http://www.youtube.com/embed/XfWibrh6stw?rel=0&autoplay=1)。

使用R-package“phom”(链接:http://cran.r-project.org/web/packages/phom/phom.pdf)可以运行以下示例。

我需要帮助才能正确理解phom函数的工作原理以及如何解释数据(plot)。

使用r中phom包的参考手册的例子#1,在R

上运行它

加载包

library(phom)
library(Rccp)

示例1

x <- runif(100)
y <- runif(100)
points <- t(as.matrix(rbind(x, y)))
max_dim <- 2
max_f <- 0.2
intervals <- pHom(points, max_dim, max_f, metric="manhattan")
plotPersistenceDiagram(intervals, max_dim, max_f,
title="Random Points in Cube with l_1 Norm")

如果有人能够帮助我,我将非常感激:

问题: a。)max_f的含义是什么?它来自何处?从我的数据?我设置它们? b。)情节:plotPersistenceDiagram(如果您在R中运行示例,您将看到该情节),我该如何解释它?

谢谢。

注意:要运行“phom”软件包,您需要“Rccp”软件包,并且需要最新版本的R 3.03。

前面的例子分别在加载“phom”和“Rccp”软件包后在R中完成。

1 个答案:

答案 0 :(得分:3)

对于这个问题,这是完全错误的地方,但是如果你在一年后仍然在努力解决这个问题,我碰巧知道答案。

计算持久同源性有两个步骤:

  1. 将点云转变为单纯复合物的过滤
  2. 计算单纯复形的同源性
  3. &#34;过滤&#34;步骤1的一部分意味着您必须为整个参数范围计算单纯复形。在这种情况下,参数是epsilon,即连接点的距离阈值。 max_f变量将epsilon扫描的范围从零限制为max_f

    plotPersistenceDiagram显示同源&#34;持久性条形码&#34;作为点而不是线。该点的x坐标是该拓扑特征的出生时间(它首次出现的epsilon的值),y坐标是死亡时间(它消失的epsilon的值)。