我在RStudio + igraph中计算网站网址的内部PageRank,运行以下脚本:
library("igraph")
links <- read.csv("C:/Users/me/Desktop/urls.csv", skip = 1)
links <- subset(links, select=c(Source,Destination))
g <- graph.data.frame(links)
pr <- page.rank(g, algo = "prpack", vids = V(g), directed = TRUE, damping = 0.85)
values <- data.frame(pr$vector)
values$names <- rownames(values)
row.names(values) <- NULL
values <- values[c(2,1)]
names(values)[1] <- "url"
names(values)[2] <- "pr"
write.csv(values, file = "C:/Users/me/Desktop/pr.csv")
有些页面计算得很好并且得到正确的数字,应该小于1。
但是对于某些网址,不依赖于网址中是否有查询字符串,pagerank caclulation结果看起来像9.50442542379295e-05
,它在Excel中显示为9,50E+09
。
这些数字是什么以及为什么在这些情况下计算失败?我该怎么办才能正确计算?或者这只是其他数字格式,我不熟悉?
答案 0 :(得分:2)
这可能只是科学记谱法。您可以全局禁用它:
options(scipen=999)
(将其还原为:)
options(scipen=0)
或仅用于该功能(如建议的here):
format(values, scientific=FALSE)