Google Cloud ML提供的建议

时间:2017-05-02 12:37:20

标签: recommendation-engine google-cloud-ml

我需要使用机器学习为音乐平台制作音乐推荐系统。

平台有:

  • 超过4亿首歌曲
  • 450多万张专辑
  • 250多万艺术家
  • 1648流派
  • 600k用户

上述对象之间的关系是:

  • 1首歌曲 - 多种类型
  • 1首歌 - 很多艺术家
  • 1首歌曲 - 1张专辑
  • 1张专辑 - 很多歌曲
  • 1张专辑 - 很多艺术家
  • 1-artist - many-albums
  • 1-artist - many-songs

我得到了用户活动(听过的歌曲)和收藏(歌曲,艺术家,专辑)

Amazon ML似乎不支持协作过滤,现在我正在浏览Google Cloud ML。

一个问题是数据的大小。基本上每首歌都有1 +类型和1 +艺术家,这些都属于绝对属性。亚马逊ML支持~100个类别(如果艺术家被视为类别,我一眼就能看到2.5米)。通过谷歌的机器学习页面,我发现只有简单的例子,所以我真的不知道从哪里开始。

作为机器学习领域的初学者,我想知道问题是我看到(尝试解决)这些建议的方式,或者即使ML是要走的路。

1 个答案:

答案 0 :(得分:2)

Google CloudML Engine是用于运行TensorFlow程序的托管解决方案。 TensorFlow是一个机器学习框架,设计时考虑到了规模。因此,只要您可以编写Distributed TensorFlow程序,就可以在CloudML Engine上运行它,这样可以很好地扩展。 (我会注意到,TensorFlow和机器学习一般都有学习曲线,但你肯定想要一个基于ML的推荐解决方案。)

快速Google search显示了使用TensorFlow构建推荐系统的多种有用材料(警告:我还没有审查过这些内容):