R清理色谱柱

时间:2013-11-21 17:07:41

标签: r

从我的角度来看,我有一个非常棘手的任务:我有一个关于大众汽车的大型数据集。一列包含汽车模型。我只想拥有VW +模式(例如大众高尔夫或大众帕萨特)。我可以用gsub删除我不需要的所有东西,但这在我看来并不高效,并且可能需要50行代码。

解决这个问题的简单而有效的方法是什么?

enter image description here

1 个答案:

答案 0 :(得分:1)

目前尚不清楚您使用gsub尝试了什么,但我会这样做:

gsub('(^VW \\w+).*','\\1',modell)

使用一些数据:

modell <- c('VW Caddy Life 1.6 ',
'VW Passat 3.2',
'VW Bora 2.8',
'VW Golf 1.4',            
'VW Passat (Kombi)')

gsub('(^VW \\w+).*','\\1',modell)
[1] "VW Caddy"  "VW Passat" "VW Bora"   "VW Golf"   "VW Passat"