Question

我正在使用Idris中经过认证的正则表达式匹配器的形式化（我相信在任何基于类型理论的证明助手中都存在相同的问题，例如Agda和Coq）并且我坚持如何定义语义补充操作。我有以下数据类型来表示正则表达式的语义：

data InRegExp : List Char -> RegExp -> Type where
 InEps : InRegExp [] Eps
 InChr : InRegExp [ a ] (Chr a)
 InCat : InRegExp xs l ->
         InRegExp ys r ->
         zs = xs ++ ys ->
         InRegExp zs (Cat l r)
 InAltL : InRegExp xs l ->
          InRegExp xs (Alt l r)
 InAltR : InRegExp xs r ->
          InRegExp xs (Alt l r)
 InStar : InRegExp xs (Alt Eps (Cat e (Star e))) ->
          InRegExp xs (Star e)
 InComp : Not (InRegExp xs e) -> InRegExp xs (Comp e)

我的问题是表示InComp构造函数的类型，因为InRegExp使用了Not，因此它具有非严格正数的InRegExp。由于这些数据类型可用于定义非终止函数，因此它们会被终止检查程序拒绝。我想用Idris终止检查器接受的方式来定义这样的语义。

是否有某些方法可以表示补充操作的语义而不会出现Transfrom: translateY的负面情况？

Answer 1

您可以通过InRegex上的递归来定义Regex。在这种情况下，严格的积极性不是问题，但我们必须在结构上进行说明：

import Data.List.Quantifiers

data Regex : Type where
  Chr  : Char -> Regex
  Eps  : Regex
  Cat  : Regex -> Regex -> Regex
  Alt  : Regex -> Regex -> Regex
  Star : Regex -> Regex
  Comp : Regex -> Regex

InRegex : List Char -> Regex -> Type
InRegex xs (Chr x)     = xs = x :: []
InRegex xs Eps         = xs = []
InRegex xs (Cat r1 r2) = (ys ** (zs ** (xs = ys ++ zs, InRegex ys r1, InRegex zs r2)))
InRegex xs (Alt r1 r2) = Either (InRegex xs r1) (InRegex xs r2)
InRegex xs (Star r)    = (yss ** (All (\ys => InRegex ys r) yss, xs = concat yss))
InRegex xs (Comp r)    = Not (InRegex xs r)

如果我们想使用旧的定义，我们需要Star案例的归纳类型。以下显然不起作用：

InRegex xs (Star r) = InRegex (Alt Eps (Cat r (Star r)))

但是，我们只需更改定义并使有限性显式化：

InRegex xs (Star r) = (yss ** (All (\ys => InRegex ys r) yss, xs = concat yss))

这具有预期的含义，我没有看到它的任何缺点。

Answer 2

您可以相互定义NotInRegExp，这可以解释正则表达式无法识别的含义（我还没有检查这是否是有效的语法）。

data NotInRegExp : List Char -> RegExp -> Type where
 NotInEps : Not (xs = []) -> NotInRegExp xs Eps
 NotInChr : Not (xs = [ a ]) -> NotInRegExp xs (Chr a)
 NotInCat : (forall xs ys, zs = xs ++ ys ->
             NotInRegExp xs l
            + InRegExp xs l * NotInRegExp ys r) ->
            NotInRegExp zs (Cat l r)
etc...

然后，您应该能够定义一个很好的决策程序：

check : (xs : List Char) (e : RegExp) -> Either (InRegexp xs e) (NotInRegexp xs e)

Answer 3

您还可以通过RegExp上的递归以及Star的语义的一些归纳数据类型来定义此类型。

我猜它不会与内置模式匹配很好地互动，但它具有相同的归纳原理。

使用补码操作形式化正则表达式

3 个答案: