我对这门整个数据科学的东西(完全菜鸟)还是很陌生。
数据:主题名称(微积分,代数,英语,......)和标记(0-10)
我的主要目标:寻找行为相似或使用该功能的人。
例如:如果我将微积分,生物学和历史标记作为输入作为输出,我希望例如50名与我具有相似标记的学生。
因此,我在看了一些教程后决定,最好的方法是使用K-nearest-Neighbors。
问题是,我在尝试梳理如何实现这一点时遇到了很多麻烦。一些一般性的建议,指南或资源将不胜感激。
这是我的第一个项目,因此我愿意接受任何建议,帮助或改进。