因素R不好玩:拉标签与水平

时间:2016-02-04 23:27:47

标签: r class label

我正在将包含大学及其会议的csv文件加载到R中。当我读取文件并创建数据框时,它会自动生成会议类因子。我想要的只是拉会议,但我只能拉出"级别"是随机数。当我使用as.character时,它存储随机数。任何人都可以帮助我吗?

以下问题花了我很长时间才取得进展,所以我非常感谢指导/协助。

> data <- read.csv("Regression Data Working File.csv",stringsAsFactors = FALSE)
# the file is essentially just a list of colleges in one column and their corresponding conference in the other column
> class(data$conference) # is a vector of college conferences (SEC, ACC, etc.)
[1] "character"
> data$conference[2]
[1] "7" # should be "ACC" and it is "ACC" when I use View(data)

1 个答案:

答案 0 :(得分:0)

好的,这就是我为解决这个问题所采取的措施。我的原始文件使用vlookup填充了会议列,但我确保将这些结果复制并粘贴为值(不知道vlookup函数而不是数据是否会影响csv文件/ r中的数据)。为了响应上面的评论提供样本数据文件,我将值复制并粘贴到一个新的excel文件中并在r中尝试了这些数据并且它有效。所以我回到了我以前的数据文件,并在另一个工作表中删除了vlookup数据,试图找到解释并解决了问题。所以我的猜测是,从excel文件到csv文件的转换使用了用于vlookup的数据数组并将值存储为。感谢您帮助解决此问题!周末愉快 谢谢, OP