我试图通过从两个变量中提取特定信息来从kangle的泰坦尼克数据集中创建一个特征变量,但我无法弄清楚如何对其进行编码。我想结合" Sex"变量和" Parch"变量。我想要的是如果乘客是带有孩子或父母的女性,则应将其编码为一个名为" WomenandChildren的新变量中的1。"如果他们是没有孩子/父母的女性或有或没有孩子的男性,则应将其编码为0。
我的理论是,有孩子的女性比没有孩子的女性或有或没有孩子的男性更容易生存。
答案 0 :(得分:1)
通过使用panda或scikit学习python库,并使用python语言,您可以组合特征变量。