我对R来说是全新的,并且拥有Python的一些经验并且使用Python中的数据框架。
我有两个数据框,DF
和Data
,它们共享多个列。 Data
中的一列(我将称之为Sign
)带有3个分类值:-1,0和1.我想在{{1}中创建Sign
列根据两个数据帧共享的列的值,预测每行DF
的值。也就是说,我想训练一个模型,使用Sign
作为我的训练数据预测Sign
的值,并特别使用Data
和{{1}中包含的列然后我的独立或预测变量,预测Data
中的DF
值。
根据一些研究,由于我的响应变量是三项分类变量,使用Sign
包来创建我的模型似乎是一个好主意,特别是使用DF
和{{1 }} 功能。我一直在使用this视频来尝试学习如何执行此操作。根据此视频,我使用nnet
和multinom
中的10个连续定量变量作为我的预测变量,成功地在predict
中培训了Sign
的模型。我将调用模型Data
。
这是我的困惑:
Data
如何允许我将我的模型应用于我的插补任务?我无法在Youtube,堆栈交换或predict
和multinom
文档中找到答案。或者我也许,但我没有意识到我在看什么。使用这些功能并没有很多明确的初学者级解释。
我猜测并尝试运行此操作以使用DF
在Sign_model
中创建predict
列:
Sign_model
当我查看整个Sign
时,结果很有希望,看起来列创建没有问题,但我无法确定我做得对。此外,当我尝试通过运行:
DF
我得到一个满是-1,0和1的矩阵。最左边的列是最终预测吗?当我单独查看此专栏时,为什么会看到矩阵?
我还想知道是否可以在我的> DF$Sign <- predict(Sign_model, DF)
模型中使用分类变量作为预测变量,因为DF
和> DF$Sign
也共享4个其他二进制列。任何帮助,将不胜感激。我试图尽可能清楚但请告诉我是否有更重要的信息我没有提供。
谢谢!