我有一个DAT文件,其大小> 5 GB,并且包含> 41百万行。为了使其在某些软件中可执行,我当然需要在打印之前通过某种操作将其转换为CSV。由于大小原因,不可能在MS Excel中使其做得很好。所以我更喜欢最后使用RStudio。
我已经尝试过仅在Rmd空间中进行编码,并且成功了。但是我的同事们也遇到了同样的问题,因此我开始在Shiny中部署代码,以使他们不安装R和RStudio,而只是访问我应该创建的某个闪亮的应用程序。
这些是完全有效的代码。我只是将它们放在Rmd中。
data <- read.table("xxx.dat")
uniq <- unique(data[,3])
df <- data.frame(uniq)
library(stringr)
data$V9 <- str_replace_all(data$V8,"-","0")
uniq <- as.character(uniq)
for(i in 1:nrow(df)){
aa <- ifelse(nchar(uniq[i])==7,paste(substr(uniq[i],1,4),substr(uniq[i],6,7),sep=""),paste(substr(uniq[i],1,5),substr(uniq[i],7,8),sep=""))
write.table(data.frame(filter(data,V3==df[i,1]))[,c(6,7,9)],sprintf('%s.csv',aa),row.names=FALSE,col.names=FALSE,sep=",")
}
我期望在Shiny中创建它,因此我的朋友可以在不安装R和RStudio的情况下使用它。在闪亮的页面中,我只想放置3个部分;
任何人都可以帮助我