编写一个函数将数据集拆分为两个

时间:2017-06-04 22:15:06

标签: function variables split arguments categories

首先,将max_hf数据集拆分为两组,Y和N。

def split_data_hf(old_data,new_data,variable,category):     new_data = old_data [old_data.variable == category] ​​

split_data_hf(max_hf,max_hf1,导入,' Y') split_data_hf(max_hf,max_hf2,导入,' N')

当我尝试运行它时,我得到了变量导入的错误(我试图通过)没有定义。任何人都可以解释为什么会这样吗?

理论上它应该可以工作,如果我从split_data_hf函数中删除变量输入然后添加导入代替变量,那么它运行得很好。

1 个答案:

答案 0 :(得分:0)

无论如何,我想我自己想出来了。

而不是

old_data [old_data.variable == category] ​​

应该写一下:

old_data [old_data [variable] == category] ​​

然后,当传递输入变量时,写“....”以传递参数。

谢谢!