在For-Loop中的接收器在R中给出了“sink stack is full”的错误

时间:2011-12-01 09:50:13

标签: r for-loop

我正在使用R中的以下数据:

> str(df)
'data.frame':   369269 obs. of  12 variables:
 $ bkod : int  110006 110006 110006 110006 110006 110006 110006 110006 110006 110006 ...
 $ bad  : Factor w/ 215 levels "4. Levent","500 Evler",..: 26 26 26 26 26 26 26 26 26 26 ...
 $ mkod : int  359 359 359 359 359 359 359 359 359 359 ...
 $ mad  : Factor w/ 8643 levels "    Hilal Gida           ",..: 4021 4021 4021 4021 4021 4021 4021 4021 4021 4021 ...
 $ yekod: int  12 12 12 12 12 12 12 12 12 12 ...
 $ yad  : Factor w/ 44 levels "BAKUGAN","BARBIE",..: 1 1 1 1 1 2 2 2 2 2 ...
 $ donem: int  201101 201103 201105 201107 201109 201102 201103 201104 201106 201107 ...
 $ sayi : int  201101 201102 201103 201104 201105 201102 201103 201104 201106 201107 ...
 $ plan : num  5 3 2 7 5 0 2 2 0 2 ...
 $ sevk : int  5 6 4 7 6 3 2 5 5 2 ...
 $ iade : int  4 1 3 5 5 2 2 5 0 2 ...
 $ satis: int  1 5 1 2 1 1 0 0 5 0 ...

bkv <- unique(df$bkod)
> bkv
  [1] 110006 110007 110010 110011 110020 110022 110027 110030 110032 110036 110043 110049 110051 110054 110056 110061 110062 110067 110069 110071 110077
 [22] 110084 110092 110093 110094 110100 110101 110104 110109 110111 110113 110116 110117 110120 110133 110138 110143 110158 110160 110162 110186 110187
 [43] 110198 110202 110208 110213 110214 110216 110218 110219 110222 110224 110229 110232 110234 110235 110247 110249 110250 110252 110255 110256 110262
 [64] 110265 110266 110268 110269 110270 110274 110277 110278 110282 110285 110295 110296 110301 110306 110309 110310 110311 110313 110314 110315 110319
 [85] 110329 110346 110351 110354 110357 110359 110377 110379 110380 110386 110392 110394 110396 110397 110400 110406 110412 110413 110419 110421 110422
[106] 110423 110426 110428 110431 110439 110442 110444 110452 110455 110464 110467 110469 110470 110471 110475 110478 110480 110485 110490 110492 110498
[127] 110499 110503 110505 110506 110508 110509 110512 110514 110517 110518 110519 110523 110532 110534 110537 110540 110543 110544 110545 110546 110547
[148] 110549 110550 110551 110553 110554 110555 110556 110557 110559 110560 110562 110565 110566 110569 110570 110571 110572 110573 110575 110576 110577
[169] 110578 110579 110580 110581 110582 110583 110584 110586 110587 110588 110589 110590 110591 110594 110595 110596 110597 110598 110599 110600 110602
[190] 110603 110605 110606 110607 110608 110609 110610 110611 110612 110613 110614 110615 110616 110617 110619 110620 110621 110622 110623 110624 110625
[211] 110626 110627 110628 110629 110630

我想要实现的是对bkv中的每个元素进行一些计算,并使用For-Loop中的sink将结果附加到txt文件。所以我创建了以下循环;

for (i in bkv) {
  new <- df[df$bkod==i,]
  dp <- new[new$plan!=new$sevk,]
  medy <- 100*(nrow(dp)/nrow(new))
  sink("Report.txt")
  cat(i, "için müdahale oranı: %", medy, "\n")
}

但它会出现以下错误:

  

接收器错误(“Report.txt”):接收器堆栈已满

它创建了Report.txt,但它是一个空文件。报告应该有215行,bkv有215个元素。

我做错了什么?如何使此循环正常工作并将结果附加到文本文件?

1 个答案:

答案 0 :(得分:5)

函数sink设置输出到文件的转移。你只在循环之前做过一次。 cat的输出将转移到您的接收器文件中,直到您使用sink()取消接收器。

因此,您的代码应该类似于:

sink("Report.txt")
for (i in bkv) {
  new <- df[df$bkod==i,]
  dp <- new[new$plan!=new$sevk,]
  medy <- 100*(nrow(dp)/nrow(new))
  cat(i, "için müdahale oranı: %", medy, "\n")
}
sink()

可能有一堆sink个文件。此堆栈的最大大小取决于操作系统允许的打开文件句柄数。


警告

我使用sink作为R newby。但我认为它有一些危险的副作用,你应该注意到。最重要的是,如果您的脚本有错误,并且您重新运行脚本,那么您的sink(filename)将被添加到接收器堆栈中。

因此,除非您对sink堆栈的簿记一丝不苟,否则会导致各种错误。

在我看来,使用cat附加到文件的能力要好得多,例如:

cat(..., file="Report.txt", append=TRUE)

或者,更好的是,编写一个包装函数。有点像:

catf <- function(..., file="report.txt", append=TRUE){
  cat(..., file=file, append=append)
}