Question

我是否正在使用getParseData修复代码中的内容。例如，将=替换为<-

txt = "
flag = F

if(flag){
        dat = data.frame(x = 1, stringAsFactor = F)
} else {
        dat <- 1
}
"

sf = parse(text = txt)
p = getParseData(sf)

p[p$token == 'EQ_ASSIGN', 'text'] = '<-'

现在如何从p - 显示已解析代码的data.frame - 返回到R代码作为字符串？谢谢

更新：尝试getParseText

首先，我无法让getParseText中的示例工作：

fn <- function(x) {
        x + 1 # A comment, kept as part of the source
}

d <- getParseData(fn)
d
# NULL

然后我尝试在我的示例中模仿?getParseText中的代码：

txt = "
flag = F

f2 = 1 + 1

if(flag){
        dat = data.frame(x = 1, stringAsFactor = F)
} else {
        dat <- 1
}
"

sf = parse(text = txt)
p = getParseData(sf)

plus <- which(p$token == "'+'")
sum <- p$parent[plus]
p[as.character(sum), ]
cat(getParseText(p, sum))
# 1 + 1

cat(getParseText(p, unique(p$parent)))
# not correct

cat(paste0(unique(getParseText(p, p$id)), collapse=" ")) # incorrect
# flag = F f2 1 + 1 1 + if(flag){
#         dat = data.frame(x = 1, stringAsFactor = F)
# } else {
#         dat <- 1
# } if ( ) {
#         dat = data.frame(x = 1, stringAsFactor = F)
# } { dat data.frame(x = 1, stringAsFactor = F) data.frame x , stringAsFactor } else {
#         dat <- 1
# } dat <- 1 <-

Answer 1

在R代码中，您无需使用getParseData用=来替换<-符号。关于R的令人惊奇的事情之一就是您可以直接在该语言上进行操作，因此我们将在这里进行。

sf = parse(text = txt)

sf是一个表达式对象，实际上是R语言对象的列表，每个顶级语句对应一个：

sf[[1]]
## flag = F
sf[[2]]
## if (flag) {
##     dat = data.frame(x = 1, stringAsFactor = F)
## } else {
##     dat <- 1
## }

以上是语言通话。调用是未经评估的R语句，您可以从parse或quote处获得：

my.call <- quote(1 + 1)
my.call
## 1 + 1
class(my.call)
## [1] "call"

关于调用的事情是R对您而言涉及其底层结构。 R调用是R特别显示和处理的列表（很好，成对列表，但此处无关紧要）。我们可以显示出它们的本质：

as.list(my.call)
## [[1]]
## `+`
## 
## [[2]]
## [1] 1
## 
## [[3]]
## [1] 1

请注意调用的前导元素是“功能”，还是在这种情况下是“运算符”，在R中无论如何它只是一个函数（更确切地说是功能/运算符的名称）。通话总是如此。第一个元素是函数，随后的元素是参数。 R假装运算符很特殊，并以不同的方式显示它们，但对于底层调用结构和评估，它们是相同的。

看看我们能做什么：

my.call[[1]] <- as.name('-')
my.call
## 1 - 1

我们使用as.name创建了一种特殊的R对象，称为符号。这些可用于引用调用中的函数。可以想象，如果我们可以将+替换为-，我们也可以对=和<-进行同样的操作。但是要系统地做到这一点，我们需要遍历语言树。我们将编写一个简单的函数来做到这一点：

symb_rep <- function(lang, from, to) {
  if(is.call(lang)) {
    if(lang[[1]] == from) lang[[1]] <- to
    lang[-1] <- lapply(lang[-1], symb_rep, from, to)
  }
  lang
}

然后我们可以在原始表达式上运行它，该表达式是一个调用列表，因此我们使用lapply来应用于每个元素：

lang.sub <- lapply(sf, symb_rep, as.name("="), as.name("<-"))
lang.sub
## [[1]]
## flag <- F
## 
## [[2]]
## if (flag) {
##     dat <- data.frame(x = 1, stringAsFactor = F)
## } else {
##     dat <- 1
## }

如果要返回字符表示，可以使用deparse：

unlist(lapply(lang.sub, deparse))
## [1] "flag <- F"                                       
## [2] "if (flag) {"                                     
## [3] "    dat <- data.frame(x = 1, stringAsFactor = F)"
## [4] "} else {"                                        
## [5] "    dat <- 1"                                    
## [6] "}"

很酷，不是吗？

最后一点，您会注意到在data.frame(x = 1, ...)中=没有被替换。这是为什么？好吧，=实际上并不存在于呼叫数据中。 R将其显示为装饰。实际上，请注意参数名称的存储方式：

as.list(quote(data.frame(x=1, y=2)))
## [[1]]
## data.frame
## 
## $x
## [1] 1
## 
## $y
## [1] 2

看不到=，因为参数名称只是调用对象的名称。 R在打印出呼叫时只是显示等号作为视觉辅助，并在解析呼叫时以相同的方式解释它们。这是“谎言”的原因，这两个表达式在语义上是不同的：

data.frame(x <- 5)
##   x....5
## 1      5
x
## [1] 5
data.frame(x = 1)
##   x
## 1 1
x
## [1] 5

在前一种情况下，R在全局环境中为x分配5，并为数据帧参数命名。在第二个中，R使用x作为参数名称，但未分配给全局环境。由于R依靠参数列表中的=来获取参数名称，因此R不能将其与常规赋值语义一起使用。

getParseData的反转：从解析的代码返回到代码

1 个答案: