确定。那个头衔太糟糕了,让我们试试一个例子吧。 让我们想象我们有这样的东西:
c1 c2
column1-x 2
column1-y 3
column2-x 5
column3 6
我希望它最终能像这样结束:
c1 c2 c3
column1-x 2 column1
column1-y 3 column1
column2-x 5 column2
column3 6 column3
正如您可能猜到的那样,尝试在一次热编码之后重新加入值重要性之后我会在c3中使所有值的总和具有相同的值,但是为此我需要能够检查值在c1之前的“ - ”中添加第三列c3。
答案 0 :(得分:2)
也许您正在寻找str.split
-
df['c3'] = df.c1.str.split('-').str[0]
df
c1 c2 c3
0 column1-x 2 column1
1 column1-y 3 column1
2 column2-x 5 column2
3 column3 6 column3