我想计算数据框列中的管道符号出现次数,它等于5,然后我需要将另一个管道(|)符号附加到现有值。
df2['smartexpenseid']
0 878497|253919815?HOTEL?141791520780|||305117||
1 362593||||35068||
2 |231931871509?CARRT?231940968972||||177849|
3 955304|248973233?HOTEL?154687992630||||93191|
4 27984||||5883|3242|
5 3579321|253872763?HOTEL?128891721799|92832814|||
6 127299|248541768?HOTEL?270593355555|||||
7 |231931871509?CARRT?231940968972||||177849|
8 831665||||80658||
9 |247132692?HOTEL?141790728905||||6249|
例如:对于第5行,(|)计数为5,因此它应该为现有值和其他行添加另一个(|),因为count是6,我们只是保持原样。有人可以帮我吗?
我试过这些
if df2['smartexpenseid'].str.count('\|')==5:
df2['smartexpenseid'].append('\|')
这让我错误地说#34;系列的真值是模棱两可的"
以及
a = df2['smartexpenseid'].str.count('\|')
if 5 in a:
a.index(5)
答案 0 :(得分:2)
所以你有vectorized str methods了。现在您需要有条件地附加额外的'|'
字符。有关详细信息,请参阅Pandas section on masking。
m = df2['smartexpenseid'].str.count('\|') == 5
df2.loc[m, 'smartexpenseid'] = df2['smartexpenseid'][m].values + '|'