我现在在R工作了几个月,所以我很新。不过,我并不陌生,我之前从未见过这个特殊问题。
我有一些调查数据,我正在解析问题和答案。我的一个问题是"你感觉如何投入?"
我对其他任何问题都没有任何问题,但当我在这个问题上尝试filter
(dplyr)时,我不断得到零匹配。然后我尝试使用grepl
代替==
。 grepl
研究了问题的子串,但不是整个问题。最终,我把它缩小到了#34;之间的空间" """这似乎是个问题。
将数据子集化并加载到名为newtest
的变量中,结果如下:
grepl("How engaged", newtest$question)
[1] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
但是:
grepl("engaged are", newtest$question)
[1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
如果我用相同的字符串覆盖列中的问题,"你感觉如何投入",一切正常。
这对于短期修复很好,但是这是一个数据库,所以我有点担心这个"空间不足"可能来自,是否有更多。即使在写出csv并重新读回之后,问题仍然存在。
对于某项事业的任何想法都将不胜感激。