数据集来自https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/
我删除了winequality_red中标头的空白,使其与winequality_white相同,因此我可以在rbind
中使用它们,而不会产生任何抱怨。
我正在尝试使用rbind
组合wine_red和wine_white。但是,rbind
不能正确组合它们,而只能从rbind()
调用中的第一个参数分配值。
我尝试使用merge
和其他功能,但是我认为rbind应该可以正常工作。看来我找不到方法。
red_wine <- read.csv2("/Users/gansaikhanshur/Documents/R/FinalProject/winequality-red.csv", stringsAsFactors = FALSE)
white_wine <- read.csv2("/Users/gansaikhanshur/Documents/R/FinalProject/winequality-white.csv", stringsAsFactors = FALSE)
white_wine$wineType <- "white"
red_wine$wineType <- "red"
wine <- rbind(white_wine, red_wine)
因此,在此示例中,酒将仅包含white_wine,而不包含red_wine。但是我想一起吃白葡萄酒和红葡萄酒。
答案 0 :(得分:1)
在原始数据集中,变量用“;”分隔不是“,”。所以我在导入它们时尝试了这些脚本。
red_wine = read.csv("winequality-red.csv", stringsAsFactors = FALSE, sep = ";")
white_wine = read.csv("winequality-white.csv", stringsAsFactors = FALSE, sep = ";")
我刚刚在sep = ";"
的末尾添加了read.csv()
自变量。而且似乎工作正常。请尝试这个。
在您的情况下,文件路径将不同。因此下面的脚本可以在您的工作目录中工作。
red_wine = read.csv("/Users/gansaikhanshur/Documents/R/FinalProject/winequality-red.csv", stringsAsFactors = FALSE, sep = ";")
white_wine = read.csv("/Users/gansaikhanshur/Documents/R/FinalProject/winequality-white.csv", stringsAsFactors = FALSE, sep = ";")
white_wine$wineType <- "white"
red_wine$wineType <- "red"
wine <- rbind(white_wine, red_wine)
希望您对此有帮助。