我正在努力制作一个图表,该图表以ggplot2的形式以rpy2的形式组合来自2个不同DF的数据。
我无法使其正常运行,就像每次只能使用一个DF。
我有2个rpy2 df:
r_df1 = pandas2ri.py2rpy(df1)
r_df_int = pandas2ri.py2rpy(df_int)
第一个DB是染色体,变体的位置和特征的数据库:
df1.head()
name chr pos status dp low
31 1-3395085-C-T 1 3395085 T 88 0
32 1-16202978-G-A 1 16202978 T 162 0
5 1-11826252-C-T 1 11826252 T 296 0
33 1-17257079-G-A 1 17257079 T 288 1
71 1-33318561-T-C 1 33318561 T 10 0
第二个DB只是间隔要传递给geom_rect的DB:
df_int
chr starts ends
0 1 0 5
1 2 5 10
2 3 10 16
3 4 16 19
4 5 19 24
5 6 24 31
6 7 31 36
7 8 36 40
8 9 40 42
9 10 42 45
10 11 45 50
11 12 50 54
12 13 54 55
13 14 55 62
14 15 62 64
15 16 64 67
16 17 67 74
17 18 74 75
18 19 75 82
19 20 82 85
20 22 85 88
21 30 88 92
并尝试将它们合并为一个图:
pp2 = ggplot2.ggplot(r_df_int) + \
ggplot2.geom_rect( ggplot2.aes_string(xmin = 'starts', xmax = 'ends', ymin = '0', ymax = '5', fill = 'factor(chr)'), alpha=0.5 ) + \
ggplot2.geom_point( data = r_df1, ggplot2.aes_string(x='sort(order(pos))', y='log(dp)', col='factor(chr)', size='dp', shape = 'factor(low)') ) + \
ggplot2.theme_minimal()
pp2.plot()
File "<stdin>", line 3
SyntaxError: positional argument follows keyword argument
只有一个可以使用。
有人知道吗?
答案 0 :(得分:0)
正如错误消息所指示的那样,该错误位于您最后一个表达式的第三行,并且与Python不允许在调用中的命名参数之后使用未命名的参数有关(R可能是这样,而不是Python)。
将data=r_df1
移到aes_string
之后,或者给第二个参数起一个名字:
ggplot2.geom_point(data=r_df1,
mapping=ggplot2.aes_string(x='sort(order(pos))',
y='log(dp)', col='factor(chr)', size='dp',
shape='factor(low)'))