我在一个文件夹中有10个数据集,有4列,我希望将它们作为r中的单独数据帧读取,为此,我可以使用以下方法:
temp = list.files(pattern="*.csv")
for(i in 1:length(temp)){
assign(paste("name",i,sep = ""), as.data.frame(read.table(temp[i])))
}
然后,如果我想更改列名称以及在同一循环或不同循环中添加新列V5 <-V3 ** 2,该怎么做。
我在stackoverflow中看到的其他更改列名的建议都建议创建一个列列表,然后进行更改。但是他们并没有在全球环境中更改数据。
任何人都可以帮忙吗?
非常感谢。
答案 0 :(得分:1)
以下内容将读入“ path”中的.csv文件,统一它们的列名并添加一个附加的计算列,然后将它们全部组合成一个数据目录。
SQL> connect as sysdba
Enter user-name: sys
Enter password:
Connected.
SQL> revoke sysdba from scott;
Revoke succeeded.
SQL>
答案 1 :(得分:0)
按照 df-01 , df-02 ... df-10 的顺序重命名所有数据集,并按以下方式读取< / p>
for(ii in 2:5){
input_csv <- sprintf('sample_-%02d.csv', ii)
read.csv(input_csv, stringsAsFactors = F,col.names=c("col1","col2","col3","col4"))
print(input_csv)
df$V5 <- df$V3**2
}