R重新编码变量 - 意外的INCOMPLETE_STRING

时间:2014-06-17 03:46:56

标签: r r-car

我正在尝试在R中重新编码一个因子变量并使用以下代码:

library(car)
napier_captureComplexity=recode(napier$a_SpatialConnectivity,"'1 - Very simple and clear:     no diagrams, single sheets'=1;'2 - Reasonably simple: some simple diagrams or second sheets'=2;'3 - Reasonably complex: multiple diagrams or sheets but can be followed'=3;'4 - Moderately complex: multiple diagrams and sheets'=4;'5 - Very complex'=5;",as.factor.result=FALSE)

并收到以下错误消息:

Error in parse(text = range[[1]][1]) : <text>:1:1: unexpected INCOMPLETE_STRING 1: '4 - Moderately complex

^低于数字4

我不确定导致这种情况的原因,我想知道:通过代码,但我没有使用c(),并且代码在数据集中具有类似字符串值的其他因素上执行得很好

感谢任何帮助!

3 个答案:

答案 0 :(得分:4)

实际上是因为&#34;:&#34;在你的描述中。此函数使用一些奇怪的evalstrsplit语句来工作。最终分裂为&#34;:&#34;因为这是他们语法中的特殊代码,似乎没有办法逃脱它。

但我假设napier$a_SpatialConnectivity是那些给定水平的因素?您可以通过在factor()调用中明确设置级别来重新编码变量。

mylevels <- c("1 - Very simple and clear:     no diagrams, single sheets",
  "2 - Reasonably simple: some simple diagrams or second sheets", 
  "3 - Reasonably complex: multiple diagrams or sheets but can be followed", 
  "4 - Moderately complex: multiple diagrams and sheets", 
  "5 - Very complex")

napier_captureComplexity <- as.numeric(factor(napier$a_SpatialConnectivity, levels=mylevels))

这将订购1:5的级别,恰好就是你试图重新编码它们的方式。

答案 1 :(得分:1)

recode似乎解释了:表示一系列值,即使它在一个字符串中,并且:被解释为过早地终止字符串。例如:

x = c("a","b","c")
recode(x, "'a'=1; 'b'=2; 'c'=3;")
[1] 1 2 3

x = c("a:d","b","c")
recode(x, "'a:d'=1; 'b'=2; 'c'=3;")
Error in parse(text = range[[1]][1]) : 
  <text>:1:1: unexpected INCOMPLETE_STRING
1: 'a
    ^

在每个例子中,我都尝试过字符串终止于:,导致错误。

答案 2 :(得分:0)

处于相似位置但使用字符串而不是因子的任何人都应该能够使用gsub从数据中删除冒号。

napier_captureComplexityy <- gsub(":","",napier$a_SpatialConnectivity)

recode字符串中省略冒号,这应该很好。