我对机器学习很新,但我希望解决以下问题。这是一种反向预测。 我有很多输入,因此每个记录一个输出。因此,我可以轻松地进行分类并预测未知新数据集的输出。 我想解决的问题是采用一个预期的结果并得到输入数据集的分类,这将最终导致预期的定义输出的概率非常高。
为了使问题更复杂,我希望能够灵活地定义一些可能无法改变的输入标准j(例如男/女)并添加这些标准,如过滤器并获得新的Revers预测 - 什么会是最相关的重要输入,除了给定的预期和定义的结果之外。
让我们举个例子:我有数以千计的学生记录,包括教育等,以及10年工作经验后获得正常或极端资金的信息。因此,如果我是一名新生,我可以预测结果,如果我将根据我的教育程度,性别,学位年龄,我正在学习的内容等赚取大量金钱或平均水平。 我想得到的是,我是男性并且在学位时有预期的年龄,我应该学习什么才能获得极高的收入?
答案 0 :(得分:0)
这个问题并不是一个独特或最佳的解决方案,尽管它可以通过多种方式解决,IMO。
要理解的关键事实是,从矢量输入到标量/分类输出的信息丢失。它不是一个可逆的'或者'可逆'转换,因为多个非常不同的输入向量可能导致相同的输出值,从而稀释信息组件。
说,问题的一个可能的攻击角度是聚类输入向量,为每个输出值获得几个相关的聚类。然后,您可以提取这些输入聚类中心,并检查这些原型值是什么导致所需的结果。通过这种方式,您可以获得所需的反向输入点'。