所以我知道here和here提出了类似的问题,但似乎没有一个问题适用于我的案例。
所以我有2个df&#39>:
df1 是包含日期,股票和该股票的相应交易数量的较小的df,非常类似:
date | symbol |trades
05.01.2010 | AAPL |34500
05.01.2010 | AET |26900
05.01.2010 | ABL |47300
df2 是一个更大的,它包含日期,股票和交易以及其他27个特征:
date |symbol| Correlation 2
2010-01-05 |AET | 0,765
2010-01-05 |ABL | 0,315
2010-01-05 |QXY | 0,2157
2010-01-05 |AAPL | 0,31
由于我需要确定从宽df1
到df2
格式的值之间的相关性,我需要从df2中提取与df1
中的日期AND符号匹配的所有行。
因此df3
中剩下的所有内容都是AET
和ABL
,但QXY
从未显示在df1
中,所以我不需要df3
{1}}。
我想用于关联的另一个措施是宽格式(df1_wide),所以我需要一些代码,这些代码只允许我提取相关性2(使用日期并将其与对齐方式相同)符号将被对齐)所以我也可以将格式换成宽格式并计算我的相关性(这将是df3_wide)
df1_wide示例:
date | AAPL | AET
05.01.2010 | 34500 | 26900
对于我的相关性,相应的df3_wide:
date | AAPL | AET
05.01.2010 | 0,31 | 0,765
答案 0 :(得分:0)
你需要设置相同的日期格式然后仔细阅读合并它也可以在两个键上进行两次合并。试一试,如果你做不到,我可以帮助你。尝试粘贴dput(your_data_frame)
中的一些代码,以便它可以轻松重现。