我为应用程序开发了一个自己的配置文件文件格式(明文和基于行 - > EOL =一种配置)。这种格式没有什么特别的,我这样做的唯一原因就是学习一些东西!读写器函数将在C中实现(使用GLib,因为它应该是UTF8编码的文件)。
现在,我正在考虑在C代码中实现此格式的方式。我必须采取哪些步骤才能获得尽可能好的错误消息。我听说过有关Lexer,Parser的一些信息......但是从来没有太深入过。我对它们只是一个非常抽象的概念。 那么我需要采取哪些步骤才能使用C语言编写一个干净的读取器格式,这对于将来的更改也是可维护的?要学习/思考的主题是什么?
是的,我知道:C很痛苦,这个提议有很多不同的“性感”格式,等等。 我想学点东西!
干杯, 格里
其他信息
答案 0 :(得分:5)
创建配置格式的一种很酷的方法是嵌入脚本语言。
这为您提供了免费的解析器,使您可以动态生成数据或定义正在重用的变量:
考虑这些xml与丑陋的伪脚本语言的例子:
<InputPoints>
<Point>
<x>1.0</x>
<y>1.0</y>
</Point>
<Point>
<x>1.0</x>
<y>2.0</y>
</Point>
<Point>
<x>1.0</x>
<y>3.0</y>
</Point>
<Point>
<x>1.0</x>
<y>4.0</y>
</Point>
<InputPoint>
VS
for(i = 1; i <= 4; ++i) {
InputPoint(1, i);
}
或者
<Username>allanballan</Username>
<Accountname>allanballan</Accountname>
<HomeDirectory>/home/allanballan</HomeDirectory>
VS
user = "allanballan";
Username = user;
Accountname = user;
HomeDirectory = "/home/"+user;
第一个示例将点列表压缩为几个语句,第二个示例显示如何使用临时变量删除大量冗余数据。
这种情况的流行语言是Lua。究竟如何将脚本语言映射到配置取决于集成商,但它非常强大,它免费提供解析和类型检查。
答案 1 :(得分:1)
您可能需要查看libconfig源代码。它有一个可以用作起点的轻量级解析器,它可能会帮助你找出你自己格式的解析器看起来像什么。
但是,如果你真的想学习解析器和词法分析器,那么实现一个简单的编译器可能会更好。您可以关注MIT course。
答案 2 :(得分:1)
根据您想要深入了解此事的深度,您应该考虑不要手动编写解析器。你当然可以这样做,但它会变得更加复杂,在你的语言中添加新功能会给你带来总是适应词法分析器和解析器代码的问题。
好处是,有很多工具可以让您从输入及其结构的高级描述中生成这些东西。标准的* nix工具是Lex和Yacc(或他们的后代Flex和Bison),但我想指的是ANTLR(http://www.antlr.org)。它的一个很好的功能是它提供了许多不同语言的后端(C / C ++以及Java,Python,Ruby,C#,...),因此如果你想切换,学习如何使用它也会有所帮助以后的语言。