python3 rpy2 ggplot2结合多个数据帧图

时间:2019-03-07 19:09:33

标签: python r ggplot2 rpy2

我正在努力制作一个图表,该图表以ggplot2的形式以rpy2的形式组合来自2个不同DF的数据。

我无法使其正常运行,就像每次只能使用一个DF。

我有2个rpy2 df:

r_df1 = pandas2ri.py2rpy(df1)
r_df_int = pandas2ri.py2rpy(df_int)

第一个DB是染色体,变体的位置和特征的数据库:

df1.head()

 name chr pos status dp low
 31 1-3395085-C-T 1 3395085 T 88 0
 32 1-16202978-G-A 1 16202978 T 162 0
 5 1-11826252-C-T 1 11826252 T 296 0
 33 1-17257079-G-A 1 17257079 T 288 1
 71 1-33318561-T-C 1 33318561 T 10 0

第二个DB只是间隔要传递给geom_rect的DB:

df_int

 chr starts ends
 0 1 0 5
 1 2 5 10
 2 3 10 16
 3 4 16 19
 4 5 19 24
 5 6 24 31
 6 7 31 36
 7 8 36 40
 8 9 40 42
 9 10 42 45
 10 11 45 50
 11 12 50 54
 12 13 54 55
 13 14 55 62
 14 15 62 64
 15 16 64 67
 16 17 67 74
 17 18 74 75
 18 19 75 82
 19 20 82 85
 20 22 85 88
 21 30 88 92

并尝试将它们合并为一个图:

pp2 = ggplot2.ggplot(r_df_int) + \
    ggplot2.geom_rect( ggplot2.aes_string(xmin = 'starts', xmax = 'ends', ymin = '0', ymax = '5', fill = 'factor(chr)'), alpha=0.5 ) + \
    ggplot2.geom_point( data = r_df1, ggplot2.aes_string(x='sort(order(pos))', y='log(dp)', col='factor(chr)', size='dp', shape = 'factor(low)') )  + \
    ggplot2.theme_minimal()


pp2.plot()

File "<stdin>", line 3
SyntaxError: positional argument follows keyword argument

只有一个可以使用。

有人知道吗?

1 个答案:

答案 0 :(得分:0)

正如错误消息所指示的那样,该错误位于您最后一个表达式的第三行,并且与Python不允许在调用中的命名参数之后使用未命名的参数有关(R可能是这样,而不是Python)。

data=r_df1移到aes_string之后,或者给第二个参数起一个名字:

ggplot2.geom_point(data=r_df1,
                   mapping=ggplot2.aes_string(x='sort(order(pos))',
                   y='log(dp)', col='factor(chr)', size='dp',
                   shape='factor(low)'))