如何更改熊猫数据框上的dtype?

时间:2020-10-06 07:49:09

标签: python regex

50s
20s
30s
40s

这是我使用正则表达式之前的数据框

我使用正则表达式删除s并在其下

import re

def split_it(data):
    return re.findall('(\d+)',data)

df_plot['age'] = df_plot['age'].apply(lambda x:split_it(x))

但是结果不好。像下面一样

[50]
[30]
[50]
[20]

那我该如何转换我的数据帧唯一数字上的数据类型??

1 个答案:

答案 0 :(得分:1)

你可以做

解决方案1:

更改功能并保持第二行不变

def split_it(data):
    return re.findall('(\d+)',data)[0]

df_plot['age'] = df_plot['age'].apply(lambda x:split_it(x))

解决方案2

不更改功能并更改第二行

def split_it(data):
    return re.findall('(\d+)',data)

df_plot['age'] = df_plot['age'].apply(lambda x:split_it(x)).str[0]