我是否可以将范围信息添加到使用`--regex- <lang>`生成的标签中生成的标签?</lang>

时间:2013-03-22 18:56:01

标签: ctags exuberant-ctags tagbar

从技术上讲,我在vim中使用Tagbar来查看文件的标签,但这个问题通常适用于繁琐的ctags,v5.8。

假设我有以下python文件,称之为foo.py

class foo:
    def bar(baz):
        print(baz)

我们在其上运行ctagsctags foo.py。生成的tags文件如下所示:

!_ some ctags version / formatting stuff not worth pasting
bar foo.py  /^    def bar(baz):$/;" m   class:foo
foo foo.py  /^class foo:$/;"    c

我感兴趣的是第二行class:foo的最后一个字段。这是bar()函数的范围。如果我在vim中使用tagbar,它会相应地将该函数嵌套在类中。

现在假设我在~/.ctags添加了对新语言的支持。事实上,我正在添加对这个puppet文件的支持:

class foo {
    include bar
}

假设我使用以下~/.ctags个参数。 'import'正则表达式是丑陋的(对于正则表达式来说是错误的......)但是在这个例子中它完成了足够的工作:

--langdef=puppet
--langmap=puppet:.pp
--regex-puppet=/^class[ \t]*([:a-zA-Z0-9_\-]+)[ \t]*/\1/c,class,classes/
--regex-puppet=/^\ \ \ \ include[ \t]*([:a-zA-Z0-9_\-]+)/\1/i,include,includes/

在我的tags文件中生成以下标记:

bar foo.pp  /^    include bar$/;"   i
foo foo.pp  /^class foo {$/;"   c

注意两行都不包含范围信息。我的问题是:无论如何,我是否通常会构建--regex-puppet参数或--regex-<LANG>行来收集有关标记范围的信息?或许可以声明满足标准A的标签总是成为符合标准B的标签的范围父项?

man ctags建议没有明确的方法来添加任意范围信息,但我可能会忽略另一种解决方案(稍微强调一下,强调):

--regex-<LANG>=/regexp/replacement/[kind-spec/][flags]

        Unless modified by flags, regexp is interpreted as a Posix extended regular expression. The replacement should expand for all matching lines  to  a  non-empty  string  of
        characters,  or  a  warning message will be reported. An optional kind specifier for tags matching regexp may follow replacement, which will determine what kind of tag is
        reported in the "kind" extension field (see TAG FILE FORMAT, below). The full form of kind-spec is in the form of a single letter, a comma, a  name  (without  spaces),  a
        comma, a description, followed by a separator, which specify the short and long forms of the kind value and its textual description (displayed using --list-kinds). Either
        the kind name and/or the description may be omitted. If kind-spec is omitted, it defaults to "r,regex". Finally, flags are one or more single-letter characters having the
        following effect upon the interpretation of regexp:

           b   The pattern is interpreted as a Posix basic regular expression.

           e   The pattern is interpreted as a Posix extended regular expression (default).

           i   The regular expression is to be applied in a case-insensitive manner.

2 个答案:

答案 0 :(得分:3)

不,遗憾的是,ctags中的正则表达式支持是不可能的。获取ctags生成正确范围的唯一方法是将解析器编写为C中的附加模块。如果我找到时间,我想添加对更好地处理新语言的支持,但到目前为止还没有努力了,我仍然不确定最好的方法。

如果您对Tagbar支持最感兴趣,那么还有另一种方法:Tagbar支持任意标记生成程序,只要它们的输出与ctags兼容,因此您可以在Python中编写一个简单的解析器并配置Tagbar使用它。看看:h tagbar-extend(特别是最后一小节“编写自己的标签生成程序”),如果这对你来说是一个选项。

答案 1 :(得分:0)

我在通用ctags项目上正在研究这样的功能: https://github.com/universal-ctags/ctags/pull/562

(不要期望太多;正则表达式解析器不足以复杂的语法。 新功能适用于语法简单的语言。)

示例1 ::

$ cat /tmp/input.foo
class foo:
def bar(baz):
    print(baz)
class goo:
def gar(gaz):
    print(gaz)

$ cat /tmp/foo.ctags
--langdef=foo
    --map-foo=+.foo
    --regex-foo=/^class[[:blank:]]+([[:alpha:]]+):/\1/c,class/{scope=set}
    --regex-foo=/^[[:blank:]]+def[[:blank:]]+([[:alpha:]]+).*:/\1/d,definition/{scope=ref}

$ ~/var/ctags/ctags --options=/tmp/foo.ctags -o - /tmp/input.foo
bar /tmp/input.foo  /^    def bar(baz):$/;" d   class:foo
foo /tmp/input.foo  /^class foo:$/;"    c
gar /tmp/input.foo  /^    def gar(gaz):$/;" d   class:goo
goo /tmp/input.foo  /^class goo:$/;"    c

示例2 ::

$ cat /tmp/input.pp
class foo {
include bar
}

$ cat /tmp/pp.ctags
--langdef=pp
    --map-pp=+.pp
    --regex-pp=/^class[[:blank:]]*([[:alnum:]]+)[[[:blank:]]]*\{/\1/c,class,classes/{scope=push}
    --regex-pp=/^[[:blank:]]*include[[:blank:]]*([[:alnum:]]+).*/\1/i,include,includes/{scope=ref}
    --regex-pp=/^[[:blank:]]*\}.*//{scope=pop}{exclusive}

$ ~/var/ctags/ctags --options=/tmp/pp.ctags -o - /tmp/input.pp
bar /tmp/input.pp   /^    include bar$/;"   i   class:foo
foo /tmp/input.pp   /^class foo {$/;"   c