我来自网络流量数据,数据量(字节数)和源和目标IP对的一周时间内的流量#。我想绘制分布,即频率与排名。 我相信R已经为此提供了一项功能。它是什么以及如何在我的场景中使用该功能。
答案 0 :(得分:3)
查看zipfR包及其dedicated website,包括以下教程:The zipfR package for lexical statistics: A tutorial introduction。
答案 1 :(得分:1)
您似乎不需要特殊功能:
x <- rpois(1000, 10)
tbl <- table(x)
plot(seq_along(tbl), unclass(tbl))
或者您正在寻找hist
?
hist(x)
答案 2 :(得分:1)
这应该是对hadley的答案的评论,但最初的问题是寻找:
plot(log10(seq_along(tbl)), log10(unclass(tbl)))
答案 3 :(得分:0)
tm
(文本挖掘)包中有一个Zipf绘图机制。
Zipf_plot(x,type =“l”,...)
答案 4 :(得分:-1)
我发现Zipf图只是按降序排序的实体频率(比如“流量”)的对数 - 对数图。