作为previous question的跟进,我遇到了以下问题(我不知道如何谷歌这一点,因为我很难解释我想做什么 - 并抱歉问题标题)。
我的数据框如下所示:
> trSpdf
Mediatype Version Collection Probability Tot.Probability percentage year
39 application/pdf -1 dk2008 2.0 1812 0.11037528 2008
40 application/pdf -1 dk2009 2.5 1174 0.21294719 2009
41 application/pdf -1 dk2010 0.5 614 0.08143322 2010
42 application/pdf 1.0 dk2007 1.0 1911 0.05232862 2007
43 application/pdf 1.0 dk2008 1.0 1812 0.05518764 2008
我还有另一个数据框,其中包含这些(和其他)版本的发布年份:
> releaseYears
Mediatype Version year
1 application/pdf 1.0 1993
2 application/pdf 1.1 1996
3 application/pdf 1.2 1996
... abcd/oadf 4.1 2003
所以我想向trSpdf
添加一个新列,该列由trSpdf$year - the corresponding releaseYears$year
计算(因此应检查Mediatype
的{{1}}和Version
并与trSpdf
的{{1}}和Mediatype
进行比较
因此,对于pdf 1.0和2007年,结果值应为14(2007 - 1993); pdf 1.1和2008年将导致15,依此类推。
提前感谢您提供任何提示/解决方案。