QDA |训练和测试数据集的长度|如何在训练和测试数据中分割数据?

时间:2016-10-11 15:52:56

标签: r statistics classification logistic-regression data-science

在QDA(二次判别分析)中,我是否需要保持训练长度和测试数据完全相同?如果没有,在这种情况下如何找到混淆矩阵

这是psuedo data

因为如果我保留不同长度的训练数据和测试数据集,则会出错(使用R Studio): “表中的错误(pred,true):所有参数必须具有相同的长度”。

试图在两个数据集上使用na.omit()删除NA以及pred和true;并使用na.action = na.exclude for qda(),但它不起作用。

将数据集分成正好一半;其中一半作为训练,一半作为测试;它在na.omit()之后在 pred和true 上完美地工作。

以下是用于任何一种方法的代码。在方法2中,数据分成相等的一半,它完全正常。

import React from 'react';
import {Router, Route, Link} from 'react-router';

class GenderField extends React.Component {
    render() {
        return (
                <div className="form-group">
                    <label htmlFor="gender">Gender</label>
                    <input type="text" className="form-control" id="gender"
                           placeholder="Gender" ref="gender"/>
                </div>
                )
            }
}

export default GenderField;

想知道我们是否有任何方法可以将混淆矩阵与数据集不等分为训练和测试数据集。

谢谢!

1 个答案:

答案 0 :(得分:0)

您是否插入了训练输入而不是测试集输入数据来预测?请注意这会产生相同的错误消息:

table(c(1,2),c(1,2,3))

如果pred的长度不正确,那么您可能错误地预测了。目前,您尚未共享任何代码,因此我不能再说什么了。但是没有理由不能使用与训练数据大小不同的测试数据来获得混淆矩阵。