从熊猫列中的引号中提取子字符串

时间:2020-05-20 13:54:19

标签: python regex pandas replace

我需要替换特殊字符,或者我需要在特殊引号内提取字符串。我已经试过df.replace了,但它不起作用。

我有这样的df

b'rgcr8fpzpx1s7x4a'
b'ue98rkzajy64hrbw'
b'u1u5ucr56y9d8rn4'

我需要这样的输出:

rgcr8fpzpx1s7x4a
 ue98rkzajy64hrbw
 u1u5ucr56y9d8rn4

2 个答案:

答案 0 :(得分:3)

我会在正则表达式中使用提取:

df[0].str.extract("b\'(.*)\'")

输出:

                  0
0  rgcr8fpzpx1s7x4a
1  ue98rkzajy64hrbw
2  u1u5ucr56y9d8rn4

答案 1 :(得分:1)

这些值似乎像字节字符串,请尝试转换为str。

df['col'] = df['col'].apply(lambda x : x.decode())

0    rgcr8fpzpx1s7x4a
1    ue98rkzajy64hrbw
2    u1u5ucr56y9d8rn4
Name: col, dtype: object