我感兴趣的是基于因变量和自变量之间的关系聚类具有1-D输出的2维输入数据。 例如,如果2个独立维度是x,则y和因变量是z,并且(x,y)和z之间的关系在xy空间中的不同区域是不同的;我想对数据进行聚类,使得xy空间中与z具有相同函数关系的区域落入一个簇中。 xy-space和z之间可能存在的函数关系是未知的apriori。
如果有人可以向我提供有关那些可以按原样使用或修改以适应此问题的机器学习技术的指示/参考,那将是很棒的。
答案 0 :(得分:3)
这个问题没有好的答案,因为这是聚类和分类技术之间整个杂交领域的核心概念。因此,已经提出了许多方法,包括将初始数据(在您的情况下为整个XYZ空间)聚类,通过独立分析每个聚类中分类模型的可能行为,以及在一个大优化问题中完全合并两个过程。在我看来,这几乎与询问“我有(x,f(x))形式的数据并想要重建”f“,我该怎么做?”
因此,引用将搜索与聚类和分类混合相关的任何内容,因为您要问的问题等同于找到一个良好的聚类来建模(部分)独立的分类/回归任务。
当然,如果你对这种功能关系的形式有所了解,那么整个问题就很容易解决。例如,如果您知道您的函数关系或多或少是高斯函数,那么您可以简单地将一些高斯混合模型拟合到您的数据中。一般而言,EM(期望最大化)在给出关于函数的一些知识的情况下将是一个很好的选择。