我在csv中的数据格式如下。我想使用这个文件为热图创建一个矩阵。我将使用R gglot。
A B C 1 apple 3 2 book 5 4 bag 1 9 desk 4 10 apple 8 11 book 66 14 desk 2
我想使用上面的文件为热图创建一个矩阵。
1 2 4 9 10 11 14
apple 3 0 0 0 8 0 0
book 0 5 0 0 0 66 0
bag 0 0 1 0 0 0 0
desk 0 0 0 4 0 0 2
我在初始文件中有另一列用于订购。
A B C D 1 apple 3 4 2 book 5 1 4 bag 1 2 9 desk 4 3 10 apple 8 4 11 book 66 1 14 desk 2 3
如何订购我的矩阵,因为这个D订购栏?或者我想以1-14列的总和订购。
答案 0 :(得分:4)
您可以使用xtabs
。
d <- read.delim(textConnection("
A B C
1 apple 3
2 book 5
4 bag 1
9 desk 4
10 apple 8
11 book 66
14 desk 2
"), sep=" ")
xtabs(C ~ B + A, d)
A
B 1 2 4 9 10 11 14
0 0 0 0 0 0 0
apple 3 0 0 0 8 0 0
bag 0 0 1 0 0 0 0
book 0 5 0 0 0 66 0
desk 0 0 0 4 0 0 2
答案 1 :(得分:0)
您可以使用read.table
执行此操作。通过在R-GUI中键入?read.table
,您可以获得选择正确参数的帮助。
答案 2 :(得分:0)
使用上面Vincent的read.delim部分和重塑方法。不那么优雅......
d <- read.delim(textConnection("
A B C
1 apple 3
2 book 5
4 bag 1
9 desk 4
10 apple 8
11 book 66
14 desk 2
"), sep=" ")
Var1 <- rep(d[,1], d[,3])
Var2 <- rep(d[,2], d[,3])
d <- data.frame(Var1=Var1, Var2=Var2)
d <- cast(melt(d), Var2~value)
> d
Var2 1 2 4 9 10 11 14
1 apple 3 0 0 0 8 0 0
2 bag 0 0 1 0 0 0 0
3 book 0 5 0 0 0 66 0
4 desk 0 0 0 4 0 0 2