我有以下数据集:
> head(data,3)
city state zip_code overall_spend
1 MIDDLESBORO KY 40965 $252,168.12
2 PALM BEACH FL 33411-3518 $369,240.74
3 CORBIN KY 40701 $292,496.03
现在,我想格式化-
之后有额外部分的zip_code。例如,在第二行中,我有33411-3518
。格式化后我想只有33411
。如何对整个zip_code列执行此操作?此外,zip_code现在是factor
答案 0 :(得分:3)
尝试
data$zip_code <- sub('-.*', '', data$zip_code)
data$zip_code
#[1] "40965" "33411" "40701"