数据框的“我的地址”列如下所示。
BX 874 E 139th St Mott Haven
455 E 148th St South Bronx,BX
3952 3rd Ave Tremont,BX
我希望此列看起来像这样。
圣莫特避风港
圣南布朗克斯
特里蒙特大街
我如何使用熊猫来做到这一点。
答案 0 :(得分:2)
尝试将str.extract
与正则表达式一起使用:
DStream
set.seed(123)
df <- data.frame(x = rep(1:3, each = 9),
y = abs(rnorm(27)),
gr1 = rep(letters[1:3], each = 3),
gr2 = rep(letters[24:26], 3))
library(ggplot2)
ggplot(df, aes(x = x, y = y, linetype = gr1, fill = gr2)) +
geom_col(position = "dodge", col = "black")
单词边界df['address'] = df['address'].str.extract(r'\b(\D+)\b,')
捕获组-任何字符,包括不不包含数字的空格,最多但不包括逗号。