标签: machine-learning statistics linear-regression
我有一个模型,该模型使用多项式和径向基函数进行训练,将数据分为训练集和测试集,并从训练集中获取很多样本。现在,我对下一步感到不知所措,我知道偏差是损失最少的样本的损失。我是根据火车数据还是测试数据计算得出的?方差只是测试集上损失的方差吗?
答案 0 :(得分:0)
此权衡的主要目标是 为决策边界找到正确的复杂程度 。
高复杂性 :(可以)记住过去,(可能)不对未来进行概括(高方差问题)
低复杂度:(由于决策边界非常简单,因此无法从过去中学到足够的知识),并且再次(可能)也无法很好地预测(高偏差问题)
可以简单地用如下图显示