Question

我无法让Tatsu解析包含文字“＃”的语法。

这是一个最小的示例：

(NA^(colSums(is.na(df[, -1])) == nrow(df))) * colSums(df[,-1]/df[[1]], na.rm = TRUE)

#     V1      V2      V3      V4      V5      V6      V7 
#     NA 0.00000 9.82143 3.69048 0.00000 0.84848 0.91883

该解析引发 FailedParse 异常。跟踪似乎表明解析器与'＃'文字不匹配：

G = r'''
atom = /[0-9]+/
     | '#' atom
     ;
'''

p = tatsu.compile(G)
p.parse('#345', trace=True)

如果我更改语法以使用'＃'以外的符号，则可以正常工作。例如，这有效：

<atom ~1:1
#345
!'' /[0-9]+/
!'#' 
!atom ~1:1
#345

不幸的是，我无法更改输入数据的格式。

Answer 1

这可能是您使用的TatSu版本中的错误。

如果您需要坚持使用该版本，请尝试在语法中包括@@eol_comments :: //或类似的模式。

这对我有用：


[ins] In [1]: import tatsu                                                                                      

[ins] In [2]: G = r''' 
         ...: atom = /[0-9]+/ 
         ...:      | '#' atom 
         ...:      ; 
         ...: ''' 
         ...:  
         ...: p = tatsu.compile(G) 
         ...: p.parse('#345', trace=True)                                                                       
↙atom ~1:1
#345
≢'' /[0-9]+/
#345
≡'#' 
345
↙atom↙atom ~1:2
345
≡'345' /[0-9]+/
≡atom↙atom 
≡atom 
Out[2]: ('#', '345')

AFTERNOTE：是，上面的输出来自TatSu的master版本（序列返回tuple），但我只是对照v4.4.0进行了检查，它是等效的

如何在达语语法中包含文字“＃”？

1 个答案: