Vera ++ TCL规则:列出所有局部变量

时间:2012-10-30 13:00:44

标签: c++ tcl vera++

我正在尝试为vera ++静态分析器编写规则。由于我没有在这里找到vera ++的组,并且vera ++使用TCL来实现其分析规则,我发布到TCL论坛。我曾经参与过vera ++ inspirel.com/vera/ce/doc/tclapi.html,但由于我不了解TCL,所以我希望建议进一步研究。

由于我是TCL编程的初学者,但是想知道TCL程序在C ++源代码文件中列出所有局部变量的方法吗?我的意思是什么方法以及它如何实现?

我面临的问题是解析C ++源代码文件以检测局部变量声明吗?

2 个答案:

答案 0 :(得分:4)

使用vera ++规则解析本地(或任何其他)变量定义非常复杂,但当然可行。基本的C ++解析和标记化由vera ++完成。

基本方法是将vera ++的getTokens函数与一个检查已完成的C ++语句的小型状态机结合使用。您需要收集令牌(并且可能是他们的值,因为您稍后需要变量名来设置列表)并连接它们直到您有完整的语句。如果您有完整的语句,则可以使用正则表达式检查它是否为变量定义,并从子匹配中提取变量名称。另外,您需要记住是否在{}块内,以了解它是否是局部变量定义。

您可以找到一个示例,用于构建一个简单的状态机,以便将标记收集到vera ++规则T019中的语句,以检查完整的花括号代码块,并将其作为起点。

我已经用vera ++解析了变量定义(以检查各种命名约定),但遗憾的是无法发布完整的代码,因为它是我雇主的专有工作。但我可以给你一个片段,显示我用来检查变量声明的正则表达式:

set isVar false
if [regexp {\s+((extern\s+)?(static\s+|mutable\s+|register\s+|volatile\s+)?(const\s+)?)?((identifier#[^#]+#\s+colon_colon\s+)*identifier#[^#]+#)\s+(star\s+|const\s+|and\s+|less.*greater\s+|greater\s+)*(identifier#[^#]+#\s+colon_colon\s+)*identifier#([^#]+)#(\s+leftbracket.*rightbracket)?(\s+assign)?.*semicolon$} $statement m s1 s2 s3 s4 s5 s6 s7 s8 s9 s10] {
    set locVarname $s9
    set isVar true
    set currentMatch $m
} elseif [regexp {\s+((extern\s+)?(static\s+|mutable\s+|register\s+|volatile\s+)?(const\s+)?)?(char\s+|int\s+|short\s+|long\s+|void\s+|bool\s+|double\s+|float\s+|unsigned\s+|and\s+|star\s+|unsigned\s+)+(identifier#[^#]+#\s+colon_colon)*\s+identifier#([^#]+)#(\s+leftbracket.*rightbracket)?(\s+assign)?.*semicolon$} $statement m s1 s2 s3 s4 s5 s6 s7 s8] {
    set locVarname $s7
    set isVar true
    set currentMatch $m
}

$statement包含前面提到的完整声明。请注意,我使用identifier将令牌值连接到identifier#<value>#令牌,并使用正则表达式组提取它。

答案 1 :(得分:1)

不幸的是,我认为你严重低估了任务的复杂性。问题是你不能对C ++文件的内容做任何猜测(无论如何受过教育),除非你真的解析它是按照C ++标准定义的,并且doing this is abysmally hard

到目前为止,显而易见的是,使用什么编程语言来实现这种解析的问题并不那么重要。你肯定可以在Tcl中实现这个,但是问题并不具体,因为以当前形式正确回答它实际上相当于发布现成的解析器代码。因此,我投票将你的问题视为非建设性的,希望你能理解。