我目前正在研究合成物。我有2个数据框。第一个数据框具有150个职业类型和相关程度的记录
df1
Occupation Degree
Biologist Masters
Cleaner High_School
Office Manager Bachelor
Software Eng. Bachelor
Data Scientist Phd
....
Data Scientist Masters
另一个是具有大约10万条记录的主数据框,
main df:
Name Degree
John Masters
Paul High_School
Mary Bachelor
Joseph Bachelor
Moses Phd
....
Helen Masters
我想使用第一个df根据个人拥有的程度将职业分配给主数据帧,但是两个数据帧上的度列都不是唯一的。
R中是否可以合并没有唯一键的数据框?
答案 0 :(得分:1)
使用末尾注释中可重复显示的数据。如果在没有其他信息的情况下,在一定程度上存在多个匹配项,我们不知道要使用哪个职业,但是我们可以列出所有匹配项,也可以任意选择其中一个。我们将使用第一种方法。 “职业”下面是一个字符列,但如果我们愿意,可以使用myplot[4,1]= myplot[4,1] + scale_y_continuous(limits = c(0,100))
myplot[4,2]= myplot[4,2] + scale_y_continuous(limits = c(0,100))
myplot[4,3]= myplot[4,3] + scale_y_continuous(limits = c(0,100))
myplot
代替layer1 = LSTM(128, activation='relu', return_sequences=True, unroll=True)(inputs)
layer2 = LSTM(128, activation='relu', unroll=True)(layer1)
,在这种情况下,它将是一个字符向量列表。
c
给予:
toString
m <- merge(main, df1, by = "Degree", all.x = TRUE)
aggregate(Occupation ~ Name + Degree, m, toString)