我正在尝试将一些.csv文件导入到公司的R中。我试图在选定的日期域上基本比较SPC。当我将数据输入R时,我将所有其他列设置为NULL,然后我尝试绘制.csv文件。当我这样做时,我的日期出现故障,我使用了sapply(mydata2, class)
并发现Date是一个因子而SPC是一个整数。我确信这是问题的一部分,一直是问题所在。我通过将Excel文件(这是一个CSV文件)日期列更改为Julian日期稍微纠正了这种情况,但为了便于演示,我宁愿以短日期格式使用它。知道如何在R中执行此操作而不必切换到Excel也是很棒的。对于kmeans聚类来说,这也是我的问题。
有什么想法吗?
我还应该提一下,我基本上试图创建一个简单的函数,从Excel文件中删除所有的废话,并基本上以各种方式计算必要的组件。我还有大约60个Excel文件,按月拆分以执行此分析。
mydata2 = read.csv("Copy of Monthly Raw SPC Aug 2015.csv")
mydata2
mydata2$Trailer <- NULL
mydata2$ProducerID <- NULL
mydata2$SampleID <- NULL
mydata2$Producer.Number <- NULL
mydata2$BTUNo <- NULL
mydata2$Route <- NULL
mydata2
plot(mydata2)
sapply(mydata2, class)
这只是一个简单的情节代码,我尝试过其他的东西,如订购或箱形图。我要绘制的实际数据样本是
...
96 42233 27000
97 42233 29000
98 42233 2000
99 42233 38000
100 42234 11000
101 42234 157000
...
而不是一般数字,第一列将是短日期格式,如96将是2015年8月16日。那么当我然后去绘图时,我的盒子和胡须图在同一天有多个条目但是日期都在图表上,我需要相同的结果但是订购的日期。
答案 0 :(得分:0)
嗯,我想出来了,经过一些推文,这是,
library(chron)
library(ggplot2)
library(maptools)
mydataE = read.csv("Copy of Monthly Raw SPC Aug 2015.csv")
mydataE
mydataRAW <- mydataE[-(161:163),]
attach(mydataRAW)
Date4 <- as.vector(Date)
Date4
Date6 <- dates(Date4, format = c(dates ="m/d/Y"), out.format = c(dates= "d/m/Y"))
Date6
u <- ggplot(dfbest, aes(factor(Date6),SPC))
u + geom_boxplot()
就是这样,它能够控制我输入日期的方式,从而订购x轴,之前,我的日期将被读作,2015年8月8日...... 2015年8月20日...... 2015年8月31日... 2015年8月4日... 2015年8月5日...然后它会在我的x轴上显示它们,所以现在我可以完全控制x轴的方式安排,图表看起来更好。 我还删除了一些错误的语法,或者至少它看起来那样,似乎当我将NULL我不需要的多个列,并且只用SPC绘制Date时它会给出我想要的箱形图,但现在如果我使用chron和ggplot2,它可以使用attach()。