尝试合并两个数据集,但str()函数显示斜杠--------

时间:2018-12-04 01:52:23

标签: r string join merge

我一直试图合并两个文件,两个文件都具有共同变量COUNTYCD(美国劳工部劳工统计局使用的县代码)。我已将它们转换为chr变量,并尝试合并/合并它们,但是无济于事。当我运行R的str()函数时,得到以下信息:

```

文件X: $ COUNTYCD:chr“ 46013”“ 46013”“ 46013”“ 46013” ...

文件Y: $ COUNTYCD:chr“ \” 01001 \“”“ \” 01003 \“”“ \” 01005 \“”“ \” 01007 \“” ...

```

我注意到文件Y具有斜杠,尽管两者都将chr表示为变量类型。知道这些斜杠是什么意思吗?我已经尝试过加入,合并和其他功能,但是它们根本无法工作。

1 个答案:

答案 0 :(得分:0)

问题出在文件Y的附加引号(由\"输出中的转义str表示)和前导空格中。

在合并之前,可以使用COUNTYCD替换引号,并使用gsub修剪其他空格。

以下是基于您(略有更改)样本数据的示例:

trimws

样本数据

merge(df1, transform(df2, COUNTYCD = trimws(gsub("\"", "", COUNTYCD))), by = "COUNTYCD")
#  COUNTYCD val_from_df1 val_from_df2
#1    46013   0.33615347    0.9586547
#2    46013   0.46372327    0.9586547
#3    46013   0.06058539    0.9586547
#4    46013   0.19743361    0.9586547