R,分类,作为一组输入的变量

时间:2016-06-13 02:06:11

标签: r classification

当分类输出仅为一组变量知道时,如何对R中的变量进行分类?可以认为这与“Mastermind”棋盘游戏相似。

或者,这是我正在研究的一个具体例子:一个人在不同的日子里吃不同类型的食物,她或者有过敏反应(对她那天吃的东西),或者她没有。这些数据可以使用很多天。什么是过敏的人?

使用真实数据,你不能做简单的消除(她在没有反应的日子里吃的所有食物都很好),因为数据中会有误报和漏报。需要一种概率方法(99%对菠菜过敏,20%对薄荷过敏等)。

1 个答案:

答案 0 :(得分:1)

这更像是一个统计101问题,因此更适合stats.stackexchange.com,但我会处理它。

您的食物类比示例的答案是使用类似

的内容
  • lm()#用于线性模型(最小二乘),单变量或多变量
  • glm()#广义线性模型(注意:尽管名称也可以将这些2用于非线性模型,如多项式回归)
  • nnet #basic neural networks and
  • randomForest()
  • caret有超过100个分类模型

等等。你可以采取数以百计甚至数千种概率方法。你可以使用正规方程,梯度下降等等。可能性几乎是无穷无尽的。

这应该让你开始:

https://cran.r-project.org/web/views/MachineLearning.html

https://cran.r-project.org/web/views/Multivariate.html

http://blog.revolutionanalytics.com/2012/08/cheat-sheet-for-prediction-and-classification-models-in-r.html

我很抱歉,但我从来没有听说过'Mastermind'。