从我的角度来看,我有一个非常棘手的任务:我有一个关于大众汽车的大型数据集。一列包含汽车模型。我只想拥有VW +模式(例如大众高尔夫或大众帕萨特)。我可以用gsub
删除我不需要的所有东西,但这在我看来并不高效,并且可能需要50行代码。
解决这个问题的简单而有效的方法是什么?
答案 0 :(得分:1)
目前尚不清楚您使用gsub
尝试了什么,但我会这样做:
gsub('(^VW \\w+).*','\\1',modell)
使用一些数据:
modell <- c('VW Caddy Life 1.6 ',
'VW Passat 3.2',
'VW Bora 2.8',
'VW Golf 1.4',
'VW Passat (Kombi)')
gsub('(^VW \\w+).*','\\1',modell)
[1] "VW Caddy" "VW Passat" "VW Bora" "VW Golf" "VW Passat"