R-package(基线)应用程序到样本数据集

时间:2016-05-20 12:38:31

标签: r algorithm baseline

我正在尝试在我拥有的样本数据集上使用R baseline-package,以测试和评估我当前的基线算法。

我想将fillpeaks算法应用为趋势线进行比较。

bc.fillPeaks <- baseline(milk$spectra[1, drop=FALSE], lambda=6,
                         hwi=50, it=10, int=2000, method="fillPeaks")
plot(bc.fillPeaks)

但我的问题是我所拥有的样本数据不符合示例中使用的矩阵结构。当我查看用于示例的data.frame时,我不理解它

'data.frame':   45 obs. of  2 variables
 $ cow    : num  0 0.25 0.375 0.875 0.5 0.75 0.5 0.125 0 0.125 ...
 $ spectra: num [1:45, 1:21451] 1029 371 606 368 554 ...
  ..- attr(*, "dimnames")=List of 2
  .. ..$ : NULL
  .. ..$ : chr  "4999.94078628963" "5001.55954267662" "5003.17856106153" "5004.79784144435" ...
 - attr(*, "terms")=Classes 'terms', 'formula' length 3 cow ~ spectra
  .. ..- attr(*, "variables")= language list(cow, spectra)
  .. ..- attr(*, "factors")= int [1:2, 1] 0 1
  .. .. ..- attr(*, "dimnames")=List of 2
  .. .. .. ..$ : chr [1:2] "cow" "spectra"
  .. .. .. ..$ : chr "spectra"
  .. ..- attr(*, "term.labels")= chr "spectra"
  .. ..- attr(*, "order")= int 1
  .. ..- attr(*, "intercept")= int 1
  .. ..- attr(*, "response")= int 1
  .. ..- attr(*, ".Environment")=<environment: R_GlobalEnv> 
  .. ..- attr(*, "predvars")= language list(cow, spectra)
  .. ..- attr(*, "dataClasses")= Named chr [1:2] "numeric" "nmatrix.21451"
  .. .. ..- attr(*, "names")= chr [1:2] "cow" "spectra"

因此,我的问题是,如果您有任何使用过基线包和数据集(牛奶)的经验,以及如何转换我所构建的数据集的想法:日期,访问次数,Old_baseline_visits 从R-package

拟合和测试基线算法

1 个答案:

答案 0 :(得分:0)

我使用过基线,发现它起初有些混乱,尤其是示例数据。正如帮助文件中所述,基线需要一个矩阵,其中的光谱在行中。即使你只有一个&#34;频谱&#34;,它也需要采用单行矩阵的形式。试试这个:

foo <- data.frame(Date=seq.Date(as.Date("1957-01-01"), by = "day", 
                            length.out = ncol(milk$spectra)),
              Visits=milk$spectra[1,],
              Old_baseline_visits=milk$spectra[1,], row.names = NULL)
foo.t <- t(foo$Visits) # Visits in a single row matrix 
bc.fillPeaks <- baseline(foo.t, lambda=6,
                     hwi=50, it=10, int=2000, method='fillPeaks')
plot(bc.fillPeaks)

如果您希望在原始数据框中返回基线和校正后的光谱,请尝试以下操作:

foo$New_baseline <- c(getBaseline(bc.fillPeaks))
foo$New_corrected <- c(getCorrected(bc.fillPeaks))
plot(foo$Date, foo$New_corrected, "l")

或者,如果您不需要基线对象,则可以使用baseline.fillPeaks(),它返回一个列表。