我有两个专栏。一栏中写着' Degree'由数据框A .like
组成的27000行字符组成master's degree
master of business administration - mba
master of business administration (mba)
b.art.des
master of engineering (m.eng.)
master of engineering studies
master of business administration (mba)
bachelor’s degree
pgdip
现在我有3个单独的CSV文件(名称为UG_alias,PG_alias,phd_alias),其中包含本科,研究生和博士学位的别名,就像本科UG_alias包含以下条目一样
bachelor
bsc
b sc
btech
b tech
b engg
bbm
bfa
bs
llb
bds
b eng
bdes
为研究生PG_alias包含
master
post graduation
msc
m sc
mba
m tech
和博士学位phd_alias包含
doctor
phd
ph d
dphil
现在我想将数据框A的Degree列映射到3个不同文件中的所有这3个别名并生成这样的输出
pg
pg
pg
ug
pg
pg
pg
ug
pg
对于UG,我正在尝试使用代码。
A$Degree[A$Degree %like% UG_Alias$Degree] <- "pg"
但是无法达到预期的输出。请帮我找一些解决方案。