k-最近邻居算法在现实生活中使用很多吗?

时间:2018-12-10 11:34:05

标签: algorithm machine-learning

我正在通过“ Python机器学习入门:数据科学家指南”一书来教自己机器学习,而我目前在k最近邻居部分。作者提到,由于“预测缓慢且无法处理许多功能”,因此该算法在现实生活中很少使用。但是,在许多文章中,k最近邻居被称为数据科学家最受欢迎的算法之一。所以,有人可以在这里为我解释吗?

1 个答案:

答案 0 :(得分:1)

由于k近邻解决的问题的性质,k近邻在机器学习中有很多应用。换句话说,k最近邻的问题是根本的,它被用于许多解决方案中。例如,在诸如tSNE的数据表示中,要运行该算法,我们需要基于预定义的困惑度来计算每个点的k最近邻。

此外,您可以在here的最后一页中找到kNN this article的更多应用及其在行业中的应用。

  

KNN算法是最受欢迎的算法之一   文本分类或文本挖掘的算法。

     

另一个有趣的应用是森林评估   库存和估计森林变量。在   在这些应用中,使用了卫星图像,   绘制很少的土地覆被和土地用途的目标   离散类。 k-NN的其他应用   农业中的方法包括气候预测和   估算土壤水分参数。

     

财务中的KNN其他一些应用是   如下所述:

     
      
  • 预测股市:预测价格   股票,根据公司绩效   措施和经济数据。
  •   
  • 货币汇率
  •   
  • 银行破产
  •   
  • 了解和管理财务风险
  •   
  • 交易期货
  •   
  • 信用等级
  •   
  • 贷款管理
  •   
  • 银行客户配置文件
  •   
  • 洗钱分析
  •   
     

医学

     
      
  • 预测是否由于以下原因而住院的患者   心脏病发作,将有第二次心脏病发作。的   预测将基于人口,饮食   和该患者的临床测量结果。
  •   
  • 估计一个人的血液中的葡萄糖量   糖尿病人,从红外线吸收   该人的血液频谱。
  •   
  • 确定前列腺癌的危险因素,   根据临床和人口统计学变量。
  •   
     

KNN算法也已应用   用于分析微阵列基因表达数据,   KNN算法已与   遗传算法,用作搜索工具。   其他应用包括溶剂预测   蛋白质分子的可及性,   入侵计算机系统及其管理   计算机等移动物体的数据库   无线连接。