我正在通过“ Python机器学习入门:数据科学家指南”一书来教自己机器学习,而我目前在k最近邻居部分。作者提到,由于“预测缓慢且无法处理许多功能”,因此该算法在现实生活中很少使用。但是,在许多文章中,k最近邻居被称为数据科学家最受欢迎的算法之一。所以,有人可以在这里为我解释吗?
答案 0 :(得分:1)
由于k近邻解决的问题的性质,k近邻在机器学习中有很多应用。换句话说,k最近邻的问题是根本的,它被用于许多解决方案中。例如,在诸如tSNE的数据表示中,要运行该算法,我们需要基于预定义的困惑度来计算每个点的k最近邻。
此外,您可以在here的最后一页中找到kNN this article的更多应用及其在行业中的应用。
KNN算法是最受欢迎的算法之一 文本分类或文本挖掘的算法。
另一个有趣的应用是森林评估 库存和估计森林变量。在 在这些应用中,使用了卫星图像, 绘制很少的土地覆被和土地用途的目标 离散类。 k-NN的其他应用 农业中的方法包括气候预测和 估算土壤水分参数。
财务中的KNN其他一些应用是 如下所述:
- 预测股市:预测价格 股票,根据公司绩效 措施和经济数据。
- 货币汇率
- 银行破产
- 了解和管理财务风险
- 交易期货
- 信用等级
- 贷款管理
- 银行客户配置文件
- 洗钱分析
医学
- 预测是否由于以下原因而住院的患者 心脏病发作,将有第二次心脏病发作。的 预测将基于人口,饮食 和该患者的临床测量结果。
- 估计一个人的血液中的葡萄糖量 糖尿病人,从红外线吸收 该人的血液频谱。
- 确定前列腺癌的危险因素, 根据临床和人口统计学变量。
KNN算法也已应用 用于分析微阵列基因表达数据, KNN算法已与 遗传算法,用作搜索工具。 其他应用包括溶剂预测 蛋白质分子的可及性, 入侵计算机系统及其管理 计算机等移动物体的数据库 无线连接。