我想知道训练数据集,测试数据集和gound真理之间的关系。我分别知道每个人的意思,但我看不出他们之间的关系,特别是地面真相和训练数据。
答案 0 :(得分:8)
您的训练数据是您训练分类器的原因。
然后,您可以在测试集上测试模型的准确性。
基本事实是指您拥有的每个训练样本的标签,即您知道每个训练样本属于哪个类别/结果
答案 1 :(得分:1)
假设我们需要训练一台机器来对橘子中的苹果进行分类。机器学习的方法是向机器“展示”橘子和苹果的一些示例(训练集),在此示例中,机器将剩下的识别为橘子或苹果(仅限于自己使用苹果和橘子!)。现在,事实真相就是您将苹果和橙子(在训练集中)定为标签。
答案 2 :(得分:0)
术语“基本事实”还有另一个重要用途。在回归问题中,知道要建模的数据的真正确定性成分是非常有价值的。
答案 3 :(得分:0)
地面真相是经过观察或测量的事实数据,可以客观地进行分析。它没有被推断。如果数据基于假设,受意见或讨论,则根据定义,这不是地面真相数据。
使用数据科学解决问题的能力在很大程度上取决于如何构建地面真相,如何构建问题和辨别而不含糊。更多信息请参见The Importance of Ground Truth in Data Science