我正在使用R(带有RStudio)来解决一些分类问题。这是我的问题: 我有这个数据集(图像代表RStudio的“环境”窗口的内容):
如您所见,我有一个包含3个变量的数据集c.data(其中2个具有2级的Factor类型:0和1)。
我想作图将变量mpg
绘制为x,将vs
绘制为y。我给R提供以下命令:
> plot(c.data$mpg, c.data$vs)
这是结果:
我不明白为什么R会自动将与变量vs
关联的值设置为具有“ 1.0”或“ 2.0”的值(我可以这样将它们显示为二进制)变量,但我不明白为什么要将它们假定为“ 0”或“ 1”作为值,则应将它们放在错误的值1和2中。这样,如果我尝试绘制逻辑回归线,就会遇到一件非常糟糕的事情:
为什么这件事发生?如何绘制y轴上的vs
的REAL值(即0.0和1.0)以绘制一条连贯的(逻辑)线?