我正在使用pycparser来解析C文件。我希望在C文件中获得每个函数定义的开始和结束。 但实际上我得到的只是函数定义的开始。
memmgr_init at examples/c_files/memmgr.c:46
get_mem_from_pool at examples/c_files/memmgr.c:55
我希望得到类似的内容:
memmgr_init at examples/c_files/memmgr.c: start :46 end : 52
class FuncDefVisitor(c_ast.NodeVisitor):
def visit_FuncDef(self, node):
print('%s at %s' % (node.decl.name, node.decl.coord))
答案 0 :(得分:0)
你不能用pycparser来做这件事,因为它在解析时不记录函数的结束位置。
您可以从AST重新生成函数体:
from pycparser import c_parser, c_ast, parse_file, c_generator
class FuncDefVisitor(c_ast.NodeVisitor):
def __init__(self, bodies):
self.bodies = bodies
self.generator = c_generator.CGenerator()
def visit_FuncDef(self, node):
self.bodies.append(self.generator.visit(node))
def show_func_defs(filename):
ast = parse_file(filename, use_cpp=True,
cpp_args=r'-Iutils/fake_libc_include')
bodies = []
v = FuncDefVisitor(bodies)
v.visit(ast)
for body in bodies:
print(body)
但是这可能与原始格式略有不同,因此不能用于计算函数结尾后的行数。
答案 1 :(得分:0)
我有一个快速而肮脏的解决方案来解决您的问题。你需要做的是从AST获得最接近的线。除非必须,否则我不喜欢修改库。我假设您熟悉解析和数据操作。如果没有,我可以添加更多细节.searser.parse方法生成一个AST类对象。 gcc_or_cpp_output是gcc或cpp生成的一些中间代码。
ast = parser.parse(gcc_or_cpp_output,filename)
AST的函数有show方法和默认参数。您需要为您的问题设置showcoord True。
ast.show(buf=fb,attrnames=True, nodenames=True, showcoord=True)
buf:
Open IO buffer into which the Node is printed.
offset:
Initial offset (amount of leading spaces)
attrnames:
True if you want to see the attribute names in
name=value pairs. False to only see the values.
nodenames:
True if you want to see the actual node names
within their parents.
showcoord:
Do you want the coordinates of each Node to be
displayed
然后,您需要将sys.stdout中的buf默认值更改为您自己的缓冲区类,以便捕获ast图。您也可以遍历树,但我会在另一天保存树遍历解决方案。我在下面写了一个简单的fake_buffer。
class fake_buffer():
def __init__(self):
self.buffer =[]
def write(self,string):
self.buffer.append(string)
def get_buffer(self):
return self.buffer
所以你现在需要做的就是将你的假缓冲区传递给ast.show()方法来获取AST。
fb = fake_buffer()
ast.show(buf=fb,attrnames=True, nodenames=True, showcoord=True)
此时您将把AST作为列表。函数声明将接近底部。现在你只需要解析所有额外的东西,并获得该函数选择中的最大坐标。
FuncCall <block_items[12]>: (at ...blah_path_stuff.../year.c:48)
ABC 永远是编码