匹配PARSE中的自定义标记

时间:2016-10-02 08:46:14

标签: parsing rebol rebol3

我正在研究字符串转换问题。要求是这样的:

line: {INSERT INTO `pub_company` VALUES ('1', '0', 'ABC大学', 'B', 'admin', '2014-10-09 11:40:44', '', '105210', null)}

==> 

line: {INSERT INTO `pub_company` VALUES ('1', '0', 'ABC大学', 'B', 'admin', to_date('2014-10-09 11:40:44', 'yyyy-mm-dd hh24:mi:ss'), '', '105210', null)}

注意'2014-10-09 11:40:44'已转换为to_date('2014-10-09 11:40:44', 'yyyy-mm-dd hh24:mi:ss')

我的代码如下所示:

date: use [digit][
    digit: charset "0123456789"
    [4 digit "-" 2 digit "-" 2 digit space 2 digit ":" 2 digit ":" 2 digit]
]
parse line [ to date to end]

但是我收到了这个错误:

** Script error: PARSE - invalid rule or usage of rule: digit
** Where: parse do either either either -apply-
** Near: parse line [to date to end]

我做了一些测试:

probe parse "SSS 2016-01-01 00:00:00" [thru 3 "S" space date to end] ;true
probe parse "SSS 2016-01-01 00:00:00" [ to date to end]  ; the error above

由于date值的位置在我的所有数据集中都不相同,我如何找到并匹配它并进行相应的更改?

4 个答案:

答案 0 :(得分:3)

TO和THRU历史上不允许任意规则作为其参数。见https://www.whatismybrowser.com/detect/what-http-headers-is-my-browser-sending

  

“TO和THRU的语法目前受设计限制,出于非常重要的性能原因......”

这是#2129。例如,以下内容将在那里工作:

parse "aabbaabbaabbccc" [
    thru [
       some "a" (prin "a") some "b" (prin "b") some "c" (prin "c")
    ]
]

然而,它输出:

abababababc

这表明它确实没有一个更好的答案,而不仅仅是“天真地”在每一步迭代地应用解析规则。循环PARSE引擎不如原子运行TO / THRU那样有效,因为存在更快的搜索方法(例如,基本字符串搜索)。并且在括号中重复执行代码可能与实际意图不符。

仍然......允许它似乎更好。然后让用户担心他们的代码何时变慢,如果重要的话,请调整性能。因此,在这方面,Rebol的relaxed in Red将与Red保持一致,并允许任意规则。

答案 1 :(得分:3)

我做了如下:

line: {INSERT INTO `pub_company` VALUES ('1', '0', 'ABC大学', 'B', 'admin', '2014-10-09 11:40:44', '', '105210', null)}

d: [2 digit]
parse/all line [some [p1: {'} 4 digit "-" d "-" d " " d ":" d ":" d {'} p2: (insert p2 ")" insert p1 "to_date(" ) | skip]]

>> {INSERT INTO `pub_company` VALUES ('1', '0', 'ABC??', 'B', 'admin', to_date('2014-10-09 11:40:44'), '', '105210', null)}

答案 2 :(得分:2)

我是以间接的方式做到的:

date: use [digit][
    digit: charset "0123456789"
    [4 digit "-" 2 digit "-" 2 digit space 2 digit ":" 2 digit ":" 2 digit]
]

line: {INSERT INTO `pub_company` VALUES ('1', '0', 'ABC大学', 'B', 'admin', '2014-10-09 11:40:44', '', '105210', null)}

parse line [
    thru "(" vals: (
        blk: parse/all vals ","
        foreach val blk [
            if parse val [" '" date "'"][
                ;probe val
                replace line val rejoin [ { to_date(} at val 2 {, 'yyyy-mm-dd hh24:mi:ss')}]
            ]
        ]
    )
    to end
    (probe line)
]

输出:

{INSERT INTO `pub_company` VALUES ('1', '0', 'ABC大学', 'B', 'admin', to_date('2014-10-09 11:40:44', 'yyyy-mm-dd hh24:mi:ss'), '', '105210', null)}

答案 3 :(得分:2)

这是一个真正的Rebol2解决方案

line: {INSERT INTO `pub_company` VALUES ('1', '0', 'ABC??', 'B', 'admin', '2014-10-09 11:40:44', '', '105210', null)}
date: use [digit space][
     space: " "
     digit: charset "0123456789"
     [4 digit "-" 2 digit "-" 2 digit space 2 digit ":" 2 digit ":" 2 digit]
]

>> parse/all line [ some [ [da: "'" date   (insert da  "to_date (" )   11 skip  de:   (insert  de " 'yyyy-mm-dd hh24:mi:ss'), ") ]  | skip ] ]
== true
>> probe line
{INSERT INTO `pub_company` VALUES ('1', '0', 'ABC??', 'B', 'admin', to_date ('2014-10-09 11:40:44', 'yyyy-mm-dd hh24:mi:ss'),  '', '105210', null)}