我正在尝试通过将数据集的一列转换为二进制输出并使其成为数据集的新列来创建离散响应变量。
if dataset['column2'] > 1000 :
dataset['y2'] = 1
else :
dataset['y2'] = 0
答案 0 :(得分:1)
import pandas as pd
df = pd.DataFrame({'column2': [998, 999, 1000, 1001, 1002]})
df['y2'] = df['column2'].apply(lambda x: 1 if x > 1000 else 0)
结果:
column2 y2
0 998 0
1 999 0
2 1000 0
3 1001 1
4 1002 1
答案 1 :(得分:-2)
在意大利,我们说您做的是糊涂!