什么机器学习模型最适合这个用例?

时间:2017-05-29 12:27:34

标签: machine-learning neural-network classification recurrent-neural-network text-classification

我希望通过访问Youtube来生成歌曲列表,这可以让用户发笑。

我可以使用哪些功能以及哪种型号最佳?目前,我正在考虑访问用户的活动,并找到他们喜欢的所有具有喜剧或音乐内容的视频,并找到这些视频'标签。然后使用这些标记并将其提供给RNN并生成搜索关键字以返回歌曲列表。但是关于他们的历史是否是他们喜欢与否的良好指标存在问题。

我是朝着正确的方向前进吗?真的很感谢一些方向的帮助。

2 个答案:

答案 0 :(得分:0)

RNN不是这类任务的好选择。当内容具有连续性时,RNN运行良好。用户观看的视频不能称为顺序数据,因为他们可以按照他们想要的顺序观看他们的视频,他们应该被推荐相同的东西。出于您的目的,您可以假设用户的历史记录是他想要观看的内容的良好指标。

对于此类任务,我建议您查看推荐系统。首先,我建议非负矩阵分解。这将给你一个良好的开端。

如果你可以缩小你的问题,也许我可以帮助你更多。

答案 1 :(得分:0)

与其他答案不同,我认为RNN将是一个非常好的匹配。用户的视频历史记录说明了用户下一步想要观看的内容。然而,我会建议你输出其他东西(等下一个预测的标签),而不是生成搜索短语的RNN。

LSTM网络是一个不错的选择,基本上如果您拥有视频的用户历史记录,则会获取这些视频的所有标记。因此,用户可能已经观看了这些视频(从上到下):

in: [Comedy, American, Pony] out: [Music, Pop, Spanish]
in: [Music, Pop, Spanish] out: [Music, Rock, American]
in: [Music, Rock, American] out: [Comedy, Music, Dance]
in: [Comedy, Music, Dance] out: predict()

然后你就像这样训练网络:

photoURL

但我建议你对输入和输出进行单热编码。我认为这将成为一个相当成功的网络!