我正在尝试将数据框 df1 的列“X”替换为dataframe df2 的列“X”。我使用以下代码:
df1$X <- df2$X
以上代码行在RStudio环境中运行良好。但是,当我从命令行在我的Ubuntu VM上运行R脚本并通过从hdfs获取的CSV文件加载数据帧时,上面的代码行给出了以下错误:
$<-.data.frame
中的错误(*tmp*
,“X”,值= c(3.688879454,:
) 替换有1464行,数据有161个
我尝试了谷歌的不同索引方法和解决方案但无法解决它。我猜这个问题可能是因为df1的列“X”有一些缺失值。我找不到解决方案来解决这个问题。
以下是相关代码行之前的代码:
require(rhdfs)
hdfs.init()
f = hdfs.file(file_input,"r",buffersize=104857600)
m = hdfs.read(f)
con = rawToChar(m)
Df1 = read.table(textConnection(con), sep = ",",header=TRUE, fill = TRUE)
f1 = hdfs.file(file_input1,"r",buffersize=104857600)
m1 = hdfs.read(f1)
con1 = rawToChar(m1)
df2 = read.table(textConnection(con1), sep = ",",header=TRUE, fill = TRUE)
Df1$X <- df2$X