什么可能导致R中的字符串具有错误的空格字符?

时间:2015-07-24 18:58:01

标签: r string corruption

我现在在R工作了几个月,所以我很新。不过,我并不陌生,我之前从未见过这个特殊问题。

我有一些调查数据,我正在解析问题和答案。我的一个问题是"你感觉如何投入?"

我对其他任何问题都没有任何问题,但当我在这个问题上尝试filter(dplyr)时,我不断得到零匹配。然后我尝试使用grepl代替==grepl研究了问题的子串,但不是整个问题。最终,我把它缩小到了#34;之间的空间" """这似乎是个问题。

将数据子集化并加载到名为newtest的变量中,结果如下:

grepl("How engaged", newtest$question)

[1] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE

但是:

grepl("engaged are", newtest$question)

[1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

如果我用相同的字符串覆盖列中的问题,"你感觉如何投入",一切正常。

这对于短期修复很好,但是这是一个数据库,所以我有点担心这个"空间不足"可能来自,是否有更多。即使在写出csv并重新读回之后,问题仍然存在。

对于某项事业的任何想法都将不胜感激。

0 个答案:

没有答案