Seaborn的sns.load_dataset()函数是否使用实际数据?

时间:2018-06-18 16:06:26

标签: python data-visualization seaborn data-science

我知道可以使用sns.load_dataset()加载的所有数据集都是示例数据集,用于Seaborn的文档,但这些示例数据集是否使用实际数据?

我在问,因为我想知道在我使用这些数据集时是否注意我得到的结果是否有用,或者我是否应该只将其视为学习模块的一种方法。

1 个答案:

答案 0 :(得分:2)

数据似乎确实存在。 Seaborn没有正式记录这一点,但是:

  • 其中一些数据集是可以在其他地方验证的“真实”知名数据集,例如在UCI的机器学习存储库上托管的Iris dataset
  • 所有数据都来自https://github.com/mwaskom/seaborn-data,而来自Michael Waskom(核心Seaborn开发人员)local drive上的实际CSV。如果数据是随机/伪造的,那么它很可能是由像NumPy这样的Python库生成的。