我正在使用Idris中经过认证的正则表达式匹配器的形式化(我相信在任何基于类型理论的证明助手中都存在相同的问题,例如Agda和Coq)并且我坚持如何定义语义补充操作。我有以下数据类型来表示正则表达式的语义:
data InRegExp : List Char -> RegExp -> Type where
InEps : InRegExp [] Eps
InChr : InRegExp [ a ] (Chr a)
InCat : InRegExp xs l ->
InRegExp ys r ->
zs = xs ++ ys ->
InRegExp zs (Cat l r)
InAltL : InRegExp xs l ->
InRegExp xs (Alt l r)
InAltR : InRegExp xs r ->
InRegExp xs (Alt l r)
InStar : InRegExp xs (Alt Eps (Cat e (Star e))) ->
InRegExp xs (Star e)
InComp : Not (InRegExp xs e) -> InRegExp xs (Comp e)
我的问题是表示InComp构造函数的类型,因为InRegExp
使用了Not
,因此它具有非严格正数的InRegExp
。由于这些数据类型可用于定义非终止函数,因此它们会被终止检查程序拒绝。我想用Idris终止检查器接受的方式来定义这样的语义。
是否有某些方法可以表示补充操作的语义而不会出现Transfrom: translateY
的负面情况?
答案 0 :(得分:6)
您可以通过InRegex
上的递归来定义Regex
。在这种情况下,严格的积极性不是问题,但我们必须在结构上进行说明:
import Data.List.Quantifiers
data Regex : Type where
Chr : Char -> Regex
Eps : Regex
Cat : Regex -> Regex -> Regex
Alt : Regex -> Regex -> Regex
Star : Regex -> Regex
Comp : Regex -> Regex
InRegex : List Char -> Regex -> Type
InRegex xs (Chr x) = xs = x :: []
InRegex xs Eps = xs = []
InRegex xs (Cat r1 r2) = (ys ** (zs ** (xs = ys ++ zs, InRegex ys r1, InRegex zs r2)))
InRegex xs (Alt r1 r2) = Either (InRegex xs r1) (InRegex xs r2)
InRegex xs (Star r) = (yss ** (All (\ys => InRegex ys r) yss, xs = concat yss))
InRegex xs (Comp r) = Not (InRegex xs r)
如果我们想使用旧的定义,我们需要Star
案例的归纳类型。以下显然不起作用:
InRegex xs (Star r) = InRegex (Alt Eps (Cat r (Star r)))
但是,我们只需更改定义并使有限性显式化:
InRegex xs (Star r) = (yss ** (All (\ys => InRegex ys r) yss, xs = concat yss))
这具有预期的含义,我没有看到它的任何缺点。
答案 1 :(得分:5)
您可以相互定义NotInRegExp
,这可以解释正则表达式无法识别的含义(我还没有检查这是否是有效的语法)。
data NotInRegExp : List Char -> RegExp -> Type where
NotInEps : Not (xs = []) -> NotInRegExp xs Eps
NotInChr : Not (xs = [ a ]) -> NotInRegExp xs (Chr a)
NotInCat : (forall xs ys, zs = xs ++ ys ->
NotInRegExp xs l
+ InRegExp xs l * NotInRegExp ys r) ->
NotInRegExp zs (Cat l r)
etc...
然后,您应该能够定义一个很好的决策程序:
check : (xs : List Char) (e : RegExp) -> Either (InRegexp xs e) (NotInRegexp xs e)
答案 2 :(得分:3)
您还可以通过RegExp上的递归以及Star的语义的一些归纳数据类型来定义此类型。
我猜它不会与内置模式匹配很好地互动,但它具有相同的归纳原理。