在R

时间:2017-09-13 16:53:36

标签: r dataframe webhdfs

我正在尝试将数据框 df1 的列“X”替换为dataframe df2 的列“X”。我使用以下代码:

df1$X <- df2$X

以上代码行在RStudio环境中运行良好。但是,当我从命令行在我的Ubuntu VM上运行R脚本并通过从hdfs获取的CSV文件加载数据帧时,上面的代码行给出了以下错误:

  

$<-.data.frame中的错误(*tmp*,“X”,值= c(3.688879454,:
)   替换有1464行,数据有161个

我尝试了谷歌的不同索引方法和解决方案但无法解决它。我猜这个问题可能是因为df1的列“X”有一些缺失值。我找不到解决方案来解决这个问题。

以下是相关代码行之前的代码:

require(rhdfs)
hdfs.init()
f = hdfs.file(file_input,"r",buffersize=104857600)
m = hdfs.read(f)
con = rawToChar(m)
Df1 = read.table(textConnection(con), sep = ",",header=TRUE, fill = TRUE)

f1 = hdfs.file(file_input1,"r",buffersize=104857600)
m1 = hdfs.read(f1)
con1 = rawToChar(m1)
df2 = read.table(textConnection(con1), sep = ",",header=TRUE, fill = TRUE)

Df1$X <- df2$X

0 个答案:

没有答案