了解熊猫数据框的预期输出

时间:2019-10-30 09:35:02

标签: python pandas

我有以下数据框,实际上包含更多的数据点和日期:

df = pd.DataFrame({'day_1': [0,1,1,0,1,1,0], 'day_2': [0,0,1,1,1,1,0], 'day_3': [0,1,1,1,0,0,0], 'day_4': [0,1,0,1,0,1,0], 'day_5': [1,0,1,1,1,0,0]})

    day_1    day_2    day_3    day_4    day_5
0       0        0        0        0        1
1       1        0        1        1        0
2       1        1        1        0        1
3       0        1        1        1        1
4       1        1        0        0        1
5       1        1        0        1        0
6       0        0        0        0        0    

零和一应连续几天出现在相同的索引处。但是,由于测量误差,预期的1有时会为零。 编辑:期望的零也可以是1。 我想建立一个简单的模型,“学习”期望的行为并给出第6天的期望输出。期望的输出是(事先不知道,但是应该由模型学习):

    day_6   
0       0  
1       1 
2       1
3       1 
4       1 
5       1      
6       0

我知道这可以通过各种机器学习选项来完成。但是,我想在一个小型微控制器中实现代码,所以我想知道是否有一种方法可以在不使用大量计算能力的情况下进行操作。

1 个答案:

答案 0 :(得分:1)

您可以做的最简单的事情是:

test_val = 0.5 # The average value for the previous days, from which you decide the output should be 1
df['day_6'] = 1 * (df.mean(axis=1) >= test_val)

这将为每行输出1,其中至少50%(test_val值)的列为1,否则为0。