Question

我在DataFrame中具有字符串："udlejning-as /8497"，并且我尝试删除"/"之前的空白，但是pd.replace和pd[].str.strip不起作用。 ..有什么建议吗？

import pandas as pd
import re
pd.set_option('display.max_colwidth', -1)

firms = pd.DataFrame({
    'url':[
        'https://cvrapi.dk/virksomhed/dk/Haki-AS/89391814;',
        'https://cvrapi.dk/virksomhed/dk/Nordsjaellands-Stilladser-ApS/87199215;',
        'https://cvrapi.dk/virksomhed/dk/Zarges ApS /87147010;',
        'https://cvrapi.dk/virksomhed/dk/Poulsen Stillads og Liftudlejning AS /84977217;'
    ]})

print(firms)

firms['url'] = firms['url'].str.lower()

firms['url'] = firms.replace({'url':{
    'æ': 'ae',
    'ø': 'oe',
    'å': 'aa',
    ' ;': ';',
    ', ': ',',
    ' /': '/)',
    ' ': '-'
}}, regex=True)

firms['url'] = firms['url'].str.replace(' /', '/')
firms.replace(' /', '/', regex=True)

print('-------')
print(firms['url'])

当我得到以下输出时，以下提到的解决方案似乎都不起作用：

0    https://cvrapi.dk/virksomhed/dk/haki-as/89391814;                              
1    https://cvrapi.dk/virksomhed/dk/nordsjaellands-stilladser-aps/87199215;        
2    https://cvrapi.dk/virksomhed/dk/zarges-aps /87147010;                          
3    https://cvrapi.dk/virksomhed/dk/poulsen-stillads-og-liftudlejning-as /84977217;

第2行和第3行有错误

Answer 1

dfr.colname = dfr.colname.str.replace(' /', '/')

Answer 2

通常：

s = "udlejning-as /8497"
s.replace(' /', '/')

对于数据框，它就像：

df.col.str.replace(' /', '/')

用于替换数据框中的所有值：

df.replace(' /', '/', regex=True)

Answer 3

尝试这个。添加您的代码

' ': '/',

在DataFrame中的“ /”之前删除空白

3 个答案: