我正在学习用R的pHom包来分析数据的拓扑结构。
我想理解(表征)一组数据(A Matrix(3500行,10列)。为了实现这样的目标,R-package phom运行描述数据的持久同源性测试。
(参考:以下视频描述了我们在拓扑中寻求同源性的方法 - 参考视频4分钟:http://www.youtube.com/embed/XfWibrh6stw?rel=0&autoplay=1)。
使用R-package“phom”(链接:http://cran.r-project.org/web/packages/phom/phom.pdf)可以运行以下示例。
我需要帮助才能正确理解phom函数的工作原理以及如何解释数据(plot)。
使用r中phom包的参考手册的例子#1,在R
上运行它library(phom)
library(Rccp)
x <- runif(100)
y <- runif(100)
points <- t(as.matrix(rbind(x, y)))
max_dim <- 2
max_f <- 0.2
intervals <- pHom(points, max_dim, max_f, metric="manhattan")
plotPersistenceDiagram(intervals, max_dim, max_f,
title="Random Points in Cube with l_1 Norm")
如果有人能够帮助我,我将非常感激:
问题: a。)max_f的含义是什么?它来自何处?从我的数据?我设置它们? b。)情节:plotPersistenceDiagram(如果您在R中运行示例,您将看到该情节),我该如何解释它?
谢谢。
注意:要运行“phom”软件包,您需要“Rccp”软件包,并且需要最新版本的R 3.03。
前面的例子分别在加载“phom”和“Rccp”软件包后在R中完成。
答案 0 :(得分:3)
对于这个问题,这是完全错误的地方,但是如果你在一年后仍然在努力解决这个问题,我碰巧知道答案。
计算持久同源性有两个步骤:
&#34;过滤&#34;步骤1的一部分意味着您必须为整个参数范围计算单纯复形。在这种情况下,参数是epsilon,即连接点的距离阈值。 max_f
变量将epsilon扫描的范围从零限制为max_f
。
plotPersistenceDiagram
显示同源&#34;持久性条形码&#34;作为点而不是线。该点的x坐标是该拓扑特征的出生时间(它首次出现的epsilon的值),y坐标是死亡时间(它消失的epsilon的值)。