我正在处理包含36列(变量)的交通违规数据集。我有两个因变量。
示例
violation id, description, age, sex , alcohol, type of vehicle, violation level, accident
id,描述,年龄,性爱酒精车辆违反级别事故
120 speed 28 M Yes car severe yes
122 win-tint 35 F No truck Medium no
123 left-turn 26 M No car light no
124 failure-veh 28 M No car severe yes
因变量是“违规程度”和“事故”。
违反级别分为3级-严重 介质 轻
事故有2级-是 不
我想预测违规水平和事故。我认为这可以是多目标预测。
有人可以帮助我使用哪种算法吗?我看到一些文章建议对scikit-multiout进行分类和具有多个out层的神经网络。
或者我可以继续使用两个模型吗?
预测流量违规级别。
使用违规级别预测事故。
基本上,我正在尝试预测违规水平,然后预测这些违规如何导致事故。
任何帮助将不胜感激。