当分类输出仅为一组变量知道时,如何对R中的变量进行分类?可以认为这与“Mastermind”棋盘游戏相似。
或者,这是我正在研究的一个具体例子:一个人在不同的日子里吃不同类型的食物,她或者有过敏反应(对她那天吃的东西),或者她没有。这些数据可以使用很多天。什么是过敏的人?
使用真实数据,你不能做简单的消除(她在没有反应的日子里吃的所有食物都很好),因为数据中会有误报和漏报。需要一种概率方法(99%对菠菜过敏,20%对薄荷过敏等)。
答案 0 :(得分:1)
这更像是一个统计101问题,因此更适合stats.stackexchange.com,但我会处理它。
您的食物类比示例的答案是使用类似
的内容lm()
#用于线性模型(最小二乘),单变量或多变量glm()
#广义线性模型(注意:尽管名称也可以将这些2用于非线性模型,如多项式回归)nnet
#basic neural networks and randomForest()
caret
有超过100个分类模型等等。你可以采取数以百计甚至数千种概率方法。你可以使用正规方程,梯度下降等等。可能性几乎是无穷无尽的。
这应该让你开始:
https://cran.r-project.org/web/views/MachineLearning.html
https://cran.r-project.org/web/views/Multivariate.html
我很抱歉,但我从来没有听说过'Mastermind'。