是否可以合并两个没有唯一键的数据框

时间:2019-09-08 14:03:24

标签: r dataframe

我目前正在研究合成物。我有2个数据框。第一个数据框具有150个职业类型和相关程度的记录

df1

Occupation         Degree
Biologist          Masters   
Cleaner            High_School
Office Manager     Bachelor
Software Eng.      Bachelor
Data Scientist     Phd
....
Data Scientist     Masters

另一个是具有大约10万条记录的主数据框,

main df:

Name         Degree
John         Masters   
Paul         High_School
Mary         Bachelor
Joseph       Bachelor
Moses        Phd
....
Helen        Masters

我想使用第一个df根据个人拥有的程度将职业分配给主数据帧,但是两个数据帧上的度列都不是唯一的。

R中是否可以合并没有唯一键的数据框?

1 个答案:

答案 0 :(得分:1)

使用末尾注释中可重复显示的数据。如果在没有其他信息的情况下,在一定程度上存在多个匹配项,我们不知道要使用哪个职业,但是我们可以列出所有匹配项,也可以任意选择其中一个。我们将使用第一种方法。 “职业”下面是一个字符列,但如果我们愿意,可以使用myplot[4,1]= myplot[4,1] + scale_y_continuous(limits = c(0,100)) myplot[4,2]= myplot[4,2] + scale_y_continuous(limits = c(0,100)) myplot[4,3]= myplot[4,3] + scale_y_continuous(limits = c(0,100)) myplot 代替layer1 = LSTM(128, activation='relu', return_sequences=True, unroll=True)(inputs) layer2 = LSTM(128, activation='relu', unroll=True)(layer1) ,在这种情况下,它将是一个字符向量列表。

c

给予:

toString

注意

m <- merge(main, df1, by = "Degree", all.x = TRUE)
aggregate(Occupation ~ Name + Degree, m, toString)