Mahout算法建议

时间:2012-03-01 23:57:49

标签: algorithm mahout

我需要的只是一个我可以开始的提示。

我对Mahout有些熟悉,至少在理论上如此。我知道它是如何工作的,如何设置等等,我可以构建一个基于协同过滤的简单推荐系统。

然而,现在我正在尝试做一些更复杂的事情,即使在阅读了不同的算法之后,我也不确定要走哪条路。

很快我想做的是:

最终目标是基于一些“已知”实体定义一组实体中的每一个的一个标量(“分数”)。实体相互作用,已知分数影响和定义未知的分数。您可以通过以下示例来设想。

如果是白色衣服和一些彩色衣服,我会有很多;红色,蓝色,绿色...我把它们放入洗衣机。我想知道洗完后白色会变成什么颜色。

需要考虑的事项:

  • 我们用不同的“演员”进行一系列的洗涤......有些衣服在第1次和第3次洗涤时洗过,有些只在第2次洗涤,有些洗完了
  • 连续洗涤之前是白色的衣服,但现在着色也会影响其余部分,但不会那么强烈(因为它们不是那么有色)
  • 某些颜色不像其他颜色那样“着色”。例如,红色对大多数衣服有很强的影响,但绿色不是很多
  • 着色效果还取决于一次洗涤中衣服的数量。如果你洗一件带有白色T恤的红色衬衫,它会变得更加有色,就像有100件白色T恤一样
  • 衣服在影响他人时不会“失去”他们的颜色

您可以看到,在计算时,实体实际上有2个指定的标量:

  • 色调(这也定义了如上所述的“着色力”)。色调可以表示为一个数字,从0到1,比如说。着色力和色数之间的相干性不是线性的。它更像是刻度的末端有更多的着色力(0和1),而中间的(0.5)有更少的
  • 颜色“亮度”(实体的颜色是多少,对于原来的彩色衣服是1,白色的是0),同时也定义着色力而不管色调

所以,再一次,我所知道的:

  • 连续洗涤的洗衣服
  • 我知道其中一些的原始颜色,其余部分在开头是白色的

我想知道的是什么: - 洗衣结束时所有衣服的色调

问题是我不知道应该从哪个(类型)算法开始。如果你到目前为止如此善良,请建议我(或进一步阅读)。

显然,我不再要求任何详细的事情,只是提示。

谢谢!

1 个答案:

答案 0 :(得分:0)

我唯一能想到的就是这个问题就像PageRank一样。它是通过一种迭代模拟计算出来的。每个页面都有一些影响(颜色)通过其链接流动(袜子用它洗过),并且在某些时候页面影响达到稳定状态(最终颜色)。你可以查找PageRank算法,但它本质上是计算一个大的,erm,袜子颜色矩阵的特征向量的问题。