我正在寻找在包含数字和非数字数据的名为“航班”的数据集上使用cor()
创建一个相关矩阵。我已经使用createDataPartition()
对数据进行了分区。
# create a data partition
flights_sampling_vector <- caret::createDataPartition(flights$delay, p = 0.8, list = FALSE, times = 1)
flights_train <- flights[flights_sampling_vector]
flights_test <- flights[-flights_sampling_vector]
flights_matrix=cor(flights, y=NULL)
cor(flights,y = NULL)错误:“ x”必须为数字
我的主要问题是cor()
函数不允许数字数据。
如何使用包含数字和非数字数据的数据创建相关矩阵?
答案 0 :(得分:0)
我将检出dplyr :: select_if()来对数字列进行子集化,然后计算这些列的相关矩阵。
library(tidyverse)
library(caret)
flights_matrix <- flights %>%
select_if(is.numeric) %>%
cor(.)