在DataFrame中的“ /”之前删除空白

时间:2019-09-02 13:51:10

标签: python python-3.x string pandas

我在DataFrame中具有字符串:"udlejning-as /8497",并且我尝试删除"/"之前的空白,但是pd.replacepd[].str.strip不起作用。 ..有什么建议吗?

import pandas as pd
import re
pd.set_option('display.max_colwidth', -1)

firms = pd.DataFrame({
    'url':[
        'https://cvrapi.dk/virksomhed/dk/Haki-AS/89391814;',
        'https://cvrapi.dk/virksomhed/dk/Nordsjaellands-Stilladser-ApS/87199215;',
        'https://cvrapi.dk/virksomhed/dk/Zarges ApS /87147010;',
        'https://cvrapi.dk/virksomhed/dk/Poulsen Stillads og Liftudlejning AS /84977217;'
    ]})

print(firms)

firms['url'] = firms['url'].str.lower()

firms['url'] = firms.replace({'url':{
    'æ': 'ae',
    'ø': 'oe',
    'å': 'aa',
    ' ;': ';',
    ', ': ',',
    ' /': '/)',
    ' ': '-'
}}, regex=True)

firms['url'] = firms['url'].str.replace(' /', '/')
firms.replace(' /', '/', regex=True)

print('-------')
print(firms['url'])

当我得到以下输出时,以下提到的解决方案似乎都不起作用:

0    https://cvrapi.dk/virksomhed/dk/haki-as/89391814;                              
1    https://cvrapi.dk/virksomhed/dk/nordsjaellands-stilladser-aps/87199215;        
2    https://cvrapi.dk/virksomhed/dk/zarges-aps /87147010;                          
3    https://cvrapi.dk/virksomhed/dk/poulsen-stillads-og-liftudlejning-as /84977217;

第2行和第3行有错误

3 个答案:

答案 0 :(得分:3)

dfr.colname = dfr.colname.str.replace(' /', '/')

答案 1 :(得分:1)

通常:

s = "udlejning-as /8497"
s.replace(' /', '/')

对于数据框,它就像:

df.col.str.replace(' /', '/')

用于替换数据框中的所有值:

df.replace(' /', '/', regex=True)

答案 2 :(得分:0)

尝试这个。添加您的代码

' ': '/',