在pandas数据帧中拼写字符串数据

时间:2016-04-18 12:20:23

标签: python pandas

我正在尝试在dataframe df中处理以下数据

Imput data

我想要一个类似excel中的分隔函数,这样我就可以用 - 和/分隔。输出应该像

Output data

请帮我解决这个问题的代码。

3 个答案:

答案 0 :(得分:3)

您可以传递一个正则表达式模式来执行此操作并传递给str.extract以仅提取没有多余字符的单词:

In [15]:    
df['str_code'].str.extract(r'(\w+)', expand=True)

Out[15]:
1                      OS
2                      OC
3    ABOFS16AWWWTP1034102
4                 stories
5                  search
6    ABOFA15AWWWTP1075401
Name: str_code, dtype: object

答案 1 :(得分:0)

DF [ 'URL'] = DF [ 'URL']。str.extract( '(\ W +)')

这是更好的方法

答案 2 :(得分:-1)

df ['str_code'] = df ['str_code']。str.strip('/')。str.split(' - ')。str [0] .str.split('/')。str [0]

这有效