我正在使用Rpy2用ggplot2绘制数据帧。我做了以下情节:
p = ggplot2.ggplot(iris) + \
ggplot2.geom_point(ggplot2.aes_string(x="Sepal.Length", y="Sepal.Width")) + \
ggplot2.facet_wrap(Formula("~Species"))
p.plot()
r["dev.off"]()
我想用一些关于情节的统计数据来注释每个子情节。例如,我想计算每个x / y子图之间的相关性,并将其放在图的右上角。如何才能做到这一点?理想情况下,我想将数据框从R转换为Python对象,计算相关性,然后将它们投影到散点图上。以下转换不起作用,但我正在尝试这样做:
# This does not work
#iris_df = pandas.DataFrame({"Sepal.Length": rpy2.robjects.default_ri2py(iris.rx("Sepal.Length")),
# "Sepal.Width": rpy2.robjects.default_ri2py(iris.rx("Sepal.Width")),
# "Species": rpy2.robjects.default_ri2py(iris.rx("Species"))})
# So we access iris using R to compute the correlation
x = iris_py.rx("Sepal.Length")
y = iris_py.rx("Sepal.Width")
# compute r.cor(x, y) and divide up by Species
# Assume we get a vector of length Species saying what the
# correlation is for each Species' Petal Length/Width
p = ggplot2.ggplot(iris) + \
ggplot2.geom_point(ggplot2.aes_string(x="Sepal.Length", y="Sepal.Width")) + \
ggplot2.facet_wrap(Formula("~Species")) + \
# ...
# How to project correlation?
p.plot()
r["dev.off"]()
但假设我实际上可以从Python访问R数据帧,我如何绘制这些相关性?感谢。
答案 0 :(得分:1)
解决方案是创建一个数据框,其中包含每个样本的标签。数据框的列应与数据框的相应列名称与原始数据匹配。然后可以用以下方式绘制:
p += ggplot2.geom_text(data=labels_df, mapping=ggplot2.aes_string(x="1", y="1", mapping="labels"))
其中labels_df
是包含标签的数据框,labels
是labels_df
的列名,其中包含要标记的标签。在这种情况下,(1,1)
将是每个子图中标签的坐标位置。
答案 1 :(得分:0)
我发现@ user248237dfsf的答案对我不起作用。 ggplot在我正在绘制的数据框和我用于标签的数据框之间感到困惑。
相反,我用过 ggplot2_env = robjects.baseenv'as.environment'class GBaseObject(robjects.RObject):
@classmethod
def new(*args, **kwargs):
args_list = list(args)
cls = args_list.pop(0)
res = cls(cls._constructor(*args_list, **kwargs))
return res
class Annotate(GBaseObject):
_constructor = ggplot2_env['annotate']
annotate = Annotate.new
现在,我有一些像标准注释一样工作的东西。
annotate(geom = "text", x = 1, y = 1, label = "MPC")
一个小评论:我不知道这是否适用于分面。