我只是尝试使用re2替换文件中的正则表达式,测试是为一个简单的字符串传递的。
# module Re2 = Re2.Std.Re2;;
# let re = Re2.create_exn "<key>Tags.*<\\/array>" ;;
# let orig = "abc <key>Tags</key><array><string>OCaml</string></array> end";;
# Re2.replace_exn ~f:(fun _ -> "<key>Tags</key><array/>") re orig;;
- : string = "abc <key>Tags</key><array/> end"
但是,当我将内容作为ss.xml
添加到文件中时:
<key>Starred</key>
<false/>
<key>Tags</key>
<array>
<string>Think</string>
<string>Performance Test</string>
<string>Racket</string>
<string>OCaml</string>
</array>
<key>Time Zone</key>
<string>Asia/Shanghai</string>
OCaml源代码:
open Core.Std
open Async.Std
module Re2 = Re2.Std.Re2
let trans_reg (input: string) : string =
let re = Re2.create_exn "<key>Tags.*<\\/array>" in
let target = "<key>Tags</key><array/>" in
Re2.replace_exn ~f:(fun _ -> target) re input
let handle_file (filename: string) =
let%bind text = Reader.file_contents filename in
Writer.save (filename ^ ".xml") ~contents:(trans_reg text)
let () =
Command.(run (async ~summary:"" Spec.empty (fun _ -> handle_file "ss.xml")))
我的新文件ss.xml.xml
中没有任何内容会发生变化。
我在想:
Match.t
中使用replace ~f:(Match.t -> string)
的参数? ()答案 0 :(得分:2)
Re2有一个选项dot_nl
,用于控制.
是否与\n
匹配。默认情况下,dot_nl
为false。您可以使用标记为here的标记语法(?s)<key>Tag.*<\\/array>
或通过调用
Re2.create ~options:[ `Dot_nl true ]
我认为此m
标志不相关,因为m
控制^
和$
的解释。您的模式不使用^
或$
。
此外,强制警告:You cannot parse XML with regex
答案 1 :(得分:0)
默认情况下,Re2会逐行匹配您的正则表达式,这就是您的表达式永远不会匹配的原因。
{{3}}提到了多行匹配的m
标记。我不知道JaneStreet对re2的绑定是否允许你设置这样的标志,但这绝对是你在这里寻找的。 p>
我会留意并且我会更新我的答案,我发现有用的东西。