prcomp“ colMeans(x,na.rm = TRUE)中的错误:“ x”必须为数字”

时间:2019-05-17 09:20:56

标签: r pca

我是R的新手,目前正在尝试为项目创建PCA图。我在excel中创建了数据表,然后将其另存为.csv文件,并声明为变量,如下所示:

> har.lip <-read.csv("HData.csv", header=TRUE, sep=",")
> head(har.lip[, 1:3])
      NAME   NUM1     NUM80
1  IN-3  4.347214  8.247082
2  IN-4  3.666815  8.108210
3  IN-5  5.779208 12.329948
4  IN-7  6.205594 22.449827
5  IN-7  5.342581 10.762976
6  IN-3  4.538335  9.711204
> pca <- prcomp(har.lip)
Error in colMeans(x, na.rm = TRUE) : 'x' must be numeric

我尝试根据自己的需要调整其他解决方案,但似乎没有用。我一直在关注教程,但是我可以使用一些其他帮助。谢谢!

1 个答案:

答案 0 :(得分:0)

根据您的数据框,看起来第一列是一个字符串。 prcomp不容许字符串。您可以做的是:

har.lip <-read.csv("HData.csv", header=TRUE, sep=",")

# Coerce to matrix, remove the first column which has characters
har.lip_mat <- as.matrix(har.lip[ ,-1])

# run function on the matrix
pca <- prcomp(har.lip_mat)

这应该为您提供所需的输出。

为说明您的其他一些问题,这里是更详细的说明:

library(dplyr)

# Make a data set that looks like yours
sim_data <- mtcars %>% 
    tibble::rownames_to_column(var = "id")

# Make your data set a matrix and remove non-numeric columns
sim_data_mat <- as.matrix(sim_data[ ,-1])

# Add row names to your matrix from original data ste
rownames(sim_data_mat) <- sim_data[ ,1]

# Keep complete cases only

sim_data_mat <- sim_data_mat[complete.cases(sim_data_mat),]

# Now run your 
prcomp(sim_data_mat)
``