基于调查分数最大或最小可能性的分类

时间:2018-06-04 12:38:49

标签: machine-learning classification

所以,我正在开发一个模型来将数据集分类为风险级别。

数据集根据受试者的调查得分进行标记。 现在,根据这项调查得分,我将获得最高和最低分数。根据调查的总体平均得分,我读了一些他们将数据标记为“高”或“低”的论文。

我很好奇的是,是否有任何方法可以根据可能性来开发模型进行分类(例如,数据实例的最大分数为60%),或者可能的方法是划分分数基于十分位数或四分位数。

我仍然对这类问题不熟悉,所以任何建议/答案都会非常感激。我要搜索的任何关键字也会非常感激。

提前致谢!

1 个答案:

答案 0 :(得分:0)

首先要做的是确定风险等级的数量。例如,对于两级分配(即高和低),可以将最小值和中值之间的分数分配给,并且可以将中值和最大值之间的分数分配给

类似地,可以使用最小,第一四分位数,中位数,第三四分位数和最大值进行4级分配。这样,您可以获得与标签相关的平衡数据集(即每个标签具有相同数量的观察值)

然后,您可以应用任何分类技术为您的问题提供模型。