我有一个CSV数据集,每行包含一个电影详细信息。 它们是:名称,预算,收入,受欢迎程度,运行时间,评级,投票,发布日期。
我想知道如何将数据集拆分为训练,验证和测试集?
当然,如何获得一些结果?
最好逐步介绍我应该从哪里开始或如何开始。
答案 0 :(得分:0)
你应该使用nntool。在你的情况下,我猜曲线拟合是适当的。所以使用nftool
在nftool中定义输入和输出,然后您可以使用nftool随机将数据划分为训练,验证和测试集。在Nftool GUI中,您可以选择分割数据的数量(80-10-10或任何)。然后,您只需按照界面,然后设置网络的细节(例如隐藏神经元的数量)。然后你只是训练网络。训练后,你可以绘制训练的表现,并根据你可以重新训练或改变隐藏神经元的数量,训练数据的百分比等表现。
您也可以查看:
http://www.mathworks.com/help/toolbox/nnet/gs/f9-35958.html