我正在使用RevoscaleR,我已成功将csv文件转换为xdf文件,我已将其保存到本地磁盘。
但是,当我尝试运行调用这些xdf文件的函数时,我收到一条错误消息,指出没有这样的文件或目录:
The file or directory 'P:/PROPENSITY/CL_Generic_Retail_201506' cannot be found.
让我揭露整个过程:
我的工作目录:
> getwd()
[1] "P:/PROPENSITY"
我使用此代码将csv文件转换为xdf:
rx_CL_Generic_Retail_201506 <- rxImport(
inData = "CL_Generic_Retail_201506_23-05-2017.csv",
outFile = "CL_Generic_Retail_201506.xdf",
overwrite = TRUE
)
然后我使用此代码检查转换是否成功:
rxSummary(formula = ~ Avg_Deposits + Total_Num_ + Sumof_CC_AVGBAL_,
data = "CL_Generic_Retail_201506.xdf"
)
Summary Statistics Results for: ~Avg_Deposits + Total_Num_ + Sumof_CC_AVGBAL_
Data: "CL_Generic_Retail_201506.xdf" (RxXdfData Data Source)
File name: CL_Generic_Retail_201506.xdf
Number of valid observations: 7155413
Name Mean StdDev Min Max ValidObs MissingObs
Avg_Deposits 4562.914627 128614.5683 -325684032 69317080.0 7155413 0
Total_Num_ 7.062068 247.1506 1 224579.0 831567 6323846
Sumof_CC_AVGBAL_ 951.484138 2249.3149 0 164746.6 601304 6554109
到目前为止,一切都很好。
我继续将文件转换为xdf文件。
然后我返回到同一个文件并尝试运行相同的函数(摘要),我收到以下错误消息:
> rxSummary(formula = ~ Avg_Deposits + Total_Num_ + Sumof_CC_AVGBAL_,
+
+ data = "CL_Generic_Retail_201506.xdf"
+
+ )
The file or directory 'CL_Generic_Retail_201506.xdf' cannot be found.
如果我重复该过程并再次运行rxImport,则rxSummary函数再次运行。但过了一会儿,同样的错误重复了。
这可能与反斜杠有关吗?
即:消息是:
The file or directory 'P:\PROPENSITY\CL_Generic_Retail_201506.xdf' cannot be found.
但当我要求R打印工作目录时,它返回:
> getwd()
[1] "P:/PROPENSITY"
注意在RevoScaleR错误消息中斜杠是\,而R的输出getwd()有/。
如果这是我能解决的问题吗?
顺便说一下,在安装了Windows和RevoScaleR的工作站中会出现此问题。在也运行RevoScaleR的笔记本中,问题不会出现。
我很感激任何建议。
这是显示文件存在的目录的图像。 Image of the PROPENSITY folder with the xdf files
答案 0 :(得分:0)
尝试使用append =“rows”。最后一个csv可能是空的,导致用空的xdf覆盖xdf,这是一个没有文件。
rx_CL_Generic_Retail_201506 <- rxImport(inData = "CL_Generic_Retail_201506_23-05-2017.csv", outFile = "CL_Generic_Retail_201506.xdf", overwrite = TRUE,
append = "rows"
)