我在DataFrame中具有字符串:"udlejning-as /8497"
,并且我尝试删除"/"
之前的空白,但是pd.replace
和pd[].str.strip
不起作用。 ..有什么建议吗?
import pandas as pd
import re
pd.set_option('display.max_colwidth', -1)
firms = pd.DataFrame({
'url':[
'https://cvrapi.dk/virksomhed/dk/Haki-AS/89391814;',
'https://cvrapi.dk/virksomhed/dk/Nordsjaellands-Stilladser-ApS/87199215;',
'https://cvrapi.dk/virksomhed/dk/Zarges ApS /87147010;',
'https://cvrapi.dk/virksomhed/dk/Poulsen Stillads og Liftudlejning AS /84977217;'
]})
print(firms)
firms['url'] = firms['url'].str.lower()
firms['url'] = firms.replace({'url':{
'æ': 'ae',
'ø': 'oe',
'å': 'aa',
' ;': ';',
', ': ',',
' /': '/)',
' ': '-'
}}, regex=True)
firms['url'] = firms['url'].str.replace(' /', '/')
firms.replace(' /', '/', regex=True)
print('-------')
print(firms['url'])
当我得到以下输出时,以下提到的解决方案似乎都不起作用:
0 https://cvrapi.dk/virksomhed/dk/haki-as/89391814;
1 https://cvrapi.dk/virksomhed/dk/nordsjaellands-stilladser-aps/87199215;
2 https://cvrapi.dk/virksomhed/dk/zarges-aps /87147010;
3 https://cvrapi.dk/virksomhed/dk/poulsen-stillads-og-liftudlejning-as /84977217;
第2行和第3行有错误
答案 0 :(得分:3)
dfr.colname = dfr.colname.str.replace(' /', '/')
答案 1 :(得分:1)
通常:
s = "udlejning-as /8497"
s.replace(' /', '/')
对于数据框,它就像:
df.col.str.replace(' /', '/')
用于替换数据框中的所有值:
df.replace(' /', '/', regex=True)
答案 2 :(得分:0)
尝试这个。添加您的代码
' ': '/',