使用ANTLR用C#解析C ++

时间:2012-09-21 08:38:12

标签: c# c++ parsing antlr

我正在尝试使用ANTLR从C#代码库中获取C ++ AST。

现在,基本工作流程对我来说似乎很清楚:使用ANTLRWorks生成.cs词法分析器和解析器,将它们和ANTLR引用添加到C#项目,给它一个C ++源代码,使用结果数据结构。

然而,我已经在第二步失败了。我从http://www.antlr.org/grammar/list下载了C ++语法(我试过Aurelian Melinte的“C ++语法”和Ramin Zaghi的“C ++语法和ANTLR 3.2代码跟踪器”)并通过设置“language = CSharp3;”来生成C#的词法分析器和解析器。 “在语法的选项中。但是,我无法编译包含解析器和词法分析器文件的C#项目。

一个问题是我不知道这是我使用的语法问题还是可用的版本问题......有很多不同版本的ANTLR,C#运行时和C#目标试图尝试每一个组合似乎是一个相当无望的任务。

然而,当前的组合似乎工作正常,一个小的示例语法出现只有一个错误(c#lexer中的“HIDDEN”需要更改为“隐藏”,就是这样),但是C ++解析器/词法分析器仍然给我很多编译器错误,主要是处理预处理程序指令和数组声明。

有没有人设法用ANTLR生成的C#文件解析C ++?有谁知道这应该如何工作?

2 个答案:

答案 0 :(得分:3)

问题在于两种语法都有嵌入式代码,而且代码是用C ++编写的。嵌入式代码在复杂的语法中非常常见,因此您需要在C#中查找用于解析C ++的语法,而不是仅仅解析C ++。作为旁注,如果您能够找到一个用Java解析C ++,可以使用IKVM从C#中使用它。

答案 1 :(得分:0)

我见过的唯一一个用于C ++的ANTLR语法被作者抛弃为不完整,他只是在尝试使用C ++ 98(YMMV)。 C ++ 11(是的,确实,C ++ 14)在这里并且要复杂得多。构建一个生产C ++ 真的很难,除非你能得到一个经过测试的版本,否则它可能不适用于实际代码。

我建议您使用Clang,EDG C ++前端或我们的DMS软件重新设计工具包,所有这些工具包都具有强大的C ++解析器。如果你想为某种目的操纵解析的C ++,你需要的机器比“纯粹的”解析器要多。