RevoScaleR找不到存在的文件,目录

时间:2017-05-24 15:15:21

标签: microsoft-r

我正在使用RevoscaleR,我已成功将csv文件转换为xdf文件,我已将其保存到本地磁盘。

但是,当我尝试运行调用这些xdf文件的函数时,我收到一条错误消息,指出没有这样的文件或目录:

The file or directory 'P:/PROPENSITY/CL_Generic_Retail_201506' cannot be found.

让我揭露整个过程:

我的工作目录:

> getwd()
[1] "P:/PROPENSITY"

我使用此代码将csv文件转换为xdf:

rx_CL_Generic_Retail_201506 <- rxImport(

  inData = "CL_Generic_Retail_201506_23-05-2017.csv",

  outFile = "CL_Generic_Retail_201506.xdf",

  overwrite = TRUE

)

然后我使用此代码检查转换是否成功:

rxSummary(formula = ~ Avg_Deposits + Total_Num_ + Sumof_CC_AVGBAL_,  

          data = "CL_Generic_Retail_201506.xdf"

)


Summary Statistics Results for: ~Avg_Deposits + Total_Num_ + Sumof_CC_AVGBAL_
Data: "CL_Generic_Retail_201506.xdf" (RxXdfData Data Source)
File name: CL_Generic_Retail_201506.xdf
Number of valid observations: 7155413 

Name             Mean        StdDev      Min        Max        ValidObs MissingObs
Avg_Deposits     4562.914627 128614.5683 -325684032 69317080.0 7155413        0   
Total_Num_          7.062068    247.1506          1   224579.0  831567  6323846   
Sumof_CC_AVGBAL_  951.484138   2249.3149          0   164746.6  601304  6554109  

到目前为止,一切都很好。

我继续将文件转换为xdf文件。

然后我返回到同一个文件并尝试运行相同的函数(摘要),我收到以下错误消息:

> rxSummary(formula = ~ Avg_Deposits + Total_Num_ + Sumof_CC_AVGBAL_,  
+           
+           data = "CL_Generic_Retail_201506.xdf"
+           
+ )

The file or directory 'CL_Generic_Retail_201506.xdf' cannot be found.

如果我重复该过程并再次运行rxImport,则rxSummary函数再次运行。但过了一会儿,同样的错误重复了。

这可能与反斜杠有关吗?

即:消息是:

The file or directory 'P:\PROPENSITY\CL_Generic_Retail_201506.xdf' cannot be found.

但当我要求R打印工作目录时,它返回:

> getwd()
[1] "P:/PROPENSITY"

注意在RevoScaleR错误消息中斜杠是\,而R的输出getwd()有/。

如果这是我能解决的问题吗?

顺便说一下,在安装了Windows和RevoScaleR的工作站中会出现此问题。在也运行RevoScaleR的笔记本中,问题不会出现。

我很感激任何建议。

----------------------------------------------- ----------------------------

这是显示文件存在的目录的图像。 Image of the PROPENSITY folder with the xdf files

1 个答案:

答案 0 :(得分:0)

尝试使用append =“rows”。最后一个csv可能是空的,导致用空的xdf覆盖xdf,这是一个没有文件。

rx_CL_Generic_Retail_201506 <- rxImport(inData = "CL_Generic_Retail_201506_23-05-2017.csv", outFile = "CL_Generic_Retail_201506.xdf",  overwrite = TRUE,
append = "rows"
)