我无法让Tatsu解析包含文字“#”的语法。
这是一个最小的示例:
(NA^(colSums(is.na(df[, -1])) == nrow(df))) * colSums(df[,-1]/df[[1]], na.rm = TRUE)
# V1 V2 V3 V4 V5 V6 V7
# NA 0.00000 9.82143 3.69048 0.00000 0.84848 0.91883
该解析引发 FailedParse 异常。跟踪似乎表明解析器与'#'文字不匹配:
G = r'''
atom = /[0-9]+/
| '#' atom
;
'''
p = tatsu.compile(G)
p.parse('#345', trace=True)
如果我更改语法以使用'#'以外的符号,则可以正常工作。例如,这有效:
<atom ~1:1
#345
!'' /[0-9]+/
!'#'
!atom ~1:1
#345
不幸的是,我无法更改输入数据的格式。
答案 0 :(得分:0)
这可能是您使用的TatSu版本中的错误。
如果您需要坚持使用该版本,请尝试在语法中包括@@eol_comments :: //
或类似的模式。
这对我有用:
[ins] In [1]: import tatsu
[ins] In [2]: G = r'''
...: atom = /[0-9]+/
...: | '#' atom
...: ;
...: '''
...:
...: p = tatsu.compile(G)
...: p.parse('#345', trace=True)
↙atom ~1:1
#345
≢'' /[0-9]+/
#345
≡'#'
345
↙atom↙atom ~1:2
345
≡'345' /[0-9]+/
≡atom↙atom
≡atom
Out[2]: ('#', '345')
AFTERNOTE:是,上面的输出来自TatSu的master
版本(序列返回tuple
),但我只是对照v4.4.0进行了检查,它是等效的