sckikit学习数据集的起源

时间:2017-06-28 08:38:56

标签: reference scikit-learn dataset

我的一个学生正在使用scikit-learn包中的糖尿病数据集来熟悉机器学习。她需要写一份关于这个的报告,并且来找我询问这些数据最初来自哪里。我们发现的唯一来源没有指定可能已生成此数据的原始出版物或队列研究。有谁知道这些数据来自哪里?

我们发现的参考文献:

  1. The scikit-learn documentation

  2. Least Angle Regression, by Efron et al. 2003(表1) [编辑]本文引用作为文献中的参考文献,但它没有包含任何有关谁采样数据集(原始科学出版物)的信息,这些信息来自哪个国家。没有实质性的迹象表明这些数据没有弥补。这些数据来自真实患者还是完全人为的数据集?通过scikit-learn学习如何使用机器学习是很好的,但是不知道训练集的来源是令人沮丧的。

1 个答案:

答案 0 :(得分:0)