我在数据框中有一个地址字段,看起来像这样

时间:2019-03-29 09:49:35

标签: python pandas

数据框的“我的地址”列如下所示。

BX 874 E 139th St Mott Haven

455 E 148th St South Bronx,BX

3952 3rd Ave Tremont,BX

我希望此列看起来像这样。

圣莫特避风港

圣南布朗克斯

特里蒙特大街

我如何使用熊猫来做到这一点。

1 个答案:

答案 0 :(得分:2)

尝试将str.extract与正则表达式一起使用:

DStream

说明

  • set.seed(123) df <- data.frame(x = rep(1:3, each = 9), y = abs(rnorm(27)), gr1 = rep(letters[1:3], each = 3), gr2 = rep(letters[24:26], 3)) library(ggplot2) ggplot(df, aes(x = x, y = y, linetype = gr1, fill = gr2)) + geom_col(position = "dodge", col = "black") 单词边界
  • df['address'] = df['address'].str.extract(r'\b(\D+)\b,') 捕获组-任何字符,包括不包含数字的空格,最多但不包括逗号。