根据以下数据,我试图使用gradeint下降来预测什么 标签将与新用户相关联。请注意,这些数字仅用于illustravite目的,实际上这些数字对应于单词。
username tags title group
user1 1 Senior group1
user2 2 Senior group2
user3 3,4,5 Junior group2
user4 2,8 Dev group1
因此,如果添加了一个新用户:“user5”,我知道该用户的标题和组可以在'r'中使用渐变下降来预测用户可能需要的标签吗?
答案 0 :(得分:4)
梯度下降是一种学习回归模型的方法(例如),而不是一种预测方法。也就是说,给定一组训练数据,您可以使用梯度下降和损失函数来确定回归模型的系数。
在您的特定情况下,我认为回归模型不是最合适的。我假设标签的数字是ID,并且没有数字的实际意义。也就是说,标签1和标签2彼此相邻,1和3相隔一个这一事实并不意味着什么。
相反,我会查看分类模型,例如决策树。如果您刚刚开始使用机器学习,我建议您查看Weka,它有许多不同的机器学习算法和相对易用的用户界面。您可以使用它快速浏览不同的算法和模型对数据的执行情况。