我有两个长度和列数相同的数据帧。我想做一个简单的rbind
,但得到错误
> outputdf<-rbind(outputdf,currentcol)
Error in `row.names<-.data.frame`(`*tmp*`, value = value) :
duplicate 'row.names' are not allowed
In addition: Warning messages:
1: In `[<-.factor`(`*tmp*`, iseq, value = c(2L, 2L, 2L, 2L, 2L, 2L, :
invalid factor level, NA generated
2: non-unique values when setting 'row.names':
之前我收到了帮助,并通过两次读取相同的csv来构建两个数据帧,以获取不同的信息部分。我正在使用这两个数据帧来构建多个数据帧。但是,在使用rbind时遇到重复的rownames错误。我在阅读csvs时尝试过row.names=FALSE
,并使用rownames(dataframe)<-NULL
进行刷新。我甚至试图重做rownames以便
rownames(dataframe2) <- c(nrow(dataframe1)+1):c(nrow(dataframe1)+nrow(dataframe2))
它为我提供了一个在前一个数据帧之后开始的范围,以避免重复的行名称。
所有这一切都失败了。我想知道我是否遗失了什么。
这是代码,其中A是我从excel表转换的csv文件
文件看起来像
country USA Britain
state NV
product peas corn
.
.
source cnn fox news
jan-02 3 5
feb-02 3 2
.
.
我之前帮助将其转换为此格式
country state product units time .... source
USA NV peas 3 Jan-02 cnn
USA NV peas 3 feb-02 cnn
Britain corn 5 jan-02 fox news
Britain corn 2 feb-02 fox news
代码是
A<-filenames[1]
#get data as separate df
datacols <- read.csv(A, header = FALSE, skip = 11, strip.white = TRUE,row.names=NULL)[-c(2:4)]
#get names as separate df
names <- read.csv(A, header = FALSE, nrows = 11, strip.white = TRUE,row.names=NULL,stringsAsFactors=FALSE)[-c(1:4)]
datanames<-c(1:11);datanames<-cbind(datanames,names)
#convertedfile dataset
outputdf<-data.frame()
#addtime into dataframe
timeframe<-datacols[1];colnames(timeframe)<-"time"
for(colindex in 2:c(ncol(datacols))){
currentcol<-timeframe
#bind price col to the current dataframe
price<-datacols[colindex];colnames(price)<-"Price"
currentcol$Price<-price
#add the country
currentcol$Country<-as.character(datanames[[colindex]][1])
#add market location
check<-as.character(datanames[[colindex]][2])
currentcol$Market_Location<-ifelse(nchar(check)<1,"na",check)
#add market name
check<-as.character(datanames[[colindex]][3])
currentcol$Market<-ifelse(nchar(check)<1,"na",check)
#add market latitude
check<-as.character(datanames[[colindex]][4])
currentcol$Market_Latitude<-ifelse(nchar(check)<1,"na",check)
#add market longitude
check<-as.character(datanames[[colindex]][5])
currentcol$Market_Longitude<-ifelse(nchar(check)<1,"na",check)
#add commodity
check<-as.character(datanames[[colindex]][6])
currentcol$Commodity<-ifelse(nchar(check)<1,"na",check)
#add produit agricoles
check<-as.character(datanames[[colindex]][7])
currentcol$produit_agricoles<-ifelse(nchar(check)<1,"na",check)
#add price type
check<-as.character(datanames[[colindex]][8])
currentcol$Price.Type<-ifelse(nchar(check)<1,"na",check)
#add unit
check<-as.character(datanames[[colindex]][9])
currentcol$Unit<-ifelse(nchar(check)<1,"na",check)
#add currency
check<-as.character(datanames[[colindex]][10])
currentcol$Currency<-ifelse(nchar(check)<1,"na",check)
#add source
check<-as.character(datanames[[colindex]][11])
currentcol$Datasource<-ifelse(nchar(check)<1,"na",check)
#bind dataframe
outputdf<-rbind(outputdf,currentcol[1,])
答案 0 :(得分:-1)
我发现了问题,我试图合并包含在其中的列表的数据帧,这就是为什么我得到了重复的rowname错误。当我写一个数据帧的测试csv时,我发现了这一点,看到它是多么混乱。我使用列的cbind而不是使用dataframe $ newvariable&lt; -data来创建数据帧