我有一个问题陈述,其中我试图预测事件的发生,即一次发生的事件是否标记为1,是否未发生的标记为0。考虑我有一个数据集,该事件发生在时间点“ t”,事件发生的时间“ t”的计算方式为(星期几+一天中的小时)。我有大量的数据集,其中大多数时间点具有0值,而角蛋白更精确地具有1值,它们的比例为8:2。 数据集为:
我尝试了某些scikit模型,例如 Logistic回归和贝叶斯模型。我还平衡了类的权重,但没有得到预期的结果。它要么由于重量级而产生全0,要么处于平衡状态(使用scikit采样),如果我现有的输入为t-> [0,0,1,0],它将始终预测1。
如果有人有任何想法,请帮忙。