我试图为不同的数据集和不同的算法绘制一堆ROC区域。 我有三个变量:“Scheme”,它指定使用的算法,“Dataset”是正在测试算法的数据集,以及“Area_under_ROC”。
我使用R中的点阵库,使用以下命令:
dotplot(Scheme~Fare_under_ROC | Dataset,data = simulationSummary,layout = c(4,6))
这就是我得到的:
dotplot of Scheme vs. Area_under_ROC conditioned on Dataset
我想知道的是
我非常感谢任何评论或指示。 非常感谢!
答案 0 :(得分:9)
一些想法:
scale=list(y=list(cex=.6))
。另一种方法是保留统一的字体大小,但将输出分隔在几个页面上(可以用layout=
控制),或者更好的是,显示来自同一数据集的所有数据(A到F,因此4每个算法的点数)或样本大小(10到100,因此每个算法6点),group=
选项。我个人会为此创建两个因素sample.size
和dataset.type
。重新调整您的因素Dataset
,以便您感兴趣的数据集显示在layout
将放置的位置,或者(更好!)使用index.cond
指定特定的排列方式你的24个面板。例如,
dfrm <- data.frame(algo=gl(11, 1, 11*24, labels=paste("algo", 1:11, sep="")),
type=gl(24, 11, 11*24, labels=paste("type", 1:24, sep="")),
roc=runif(11*24))
p <- dotplot(algo ~ roc | type, dfrm, layout=c(4,6), scale=list(y=list(cex=.4)))
将按顺序排列面板,从左下角到右上角(左下方的type1
,右上角的type24
),而
update(p, index.cond=list(24:1))
将按相反顺序排列面板。只需指定具有预期面板位置的list
。
以下是我对第1点的想法和使用两个因素而不是一个因素的例子。让我们生成另一个人工数据集:
dfrm <- data.frame(algo=gl(11, 1, 11*24, labels=paste("algo", 1:11, sep="")),
dataset=gl(6, 11, 11*24, labels=LETTERS[1:6]),
ssize=gl(4, 11*6, 11*24, labels=c(10,25,50,100)),
roc=runif(11*24))
xtabs(~ dataset + ssize, dfrm) # to check allocation of factor levels
dotplot(algo ~ roc | dataset, data=dfrm, group=ssize, type="l",
auto.key=list(space="top", column=4, cex=.8, title="Sample size",
cex.title=1, lines=TRUE, points=FALSE))
答案 1 :(得分:5)
将Dataset
类型拆分为“类型和大小”后,您可以{/ 3}}使用来自latticeExtra包的chl answer函数。
为了获得更多标签空间,您可以“转置”情节。
# prepare data:
simulationSummary$Dataset_type <- substr(simulationSummary$Dataset, 1, 5)
simulationSummary$Dataset_size <- substr(simulationSummary$Dataset, 6, 10)
# to gets proper order force factor levels:
simulationSummary$Dataset_size <- factor(simulationSummary$Dataset_size,
levels = c("10", "25", "50", "100"))
library(latticeExtra)
useOuterStrips(dotplot(
Scheme ~ Area_under_ROC | Dataset_type*Dataset_size,
data = simulationSummary,
layout = c(4,6)
))
或使用vertical dotplot:
useOuterStrips(dotplot(
Area_under_ROC ~ Scheme | Dataset_size*Dataset_type,
data = simulationSummary, horizontal=FALSE,
layout = c(4,6), scales=list(x=list(rot=90))
))