请建议一个好的文本处理项目

时间:2010-06-03 23:54:11

标签: c project text-processing

最近我意识到必须善于处理(解析)文本。它可能就像解释HTTP响应或读取设置文件(* .ini或* .xml或* .json)一样简单,就像编写编译器或正则表达式引擎一样困难。

我同意现在我们有用于解释流行文本格式的库函数/方法。但是使用函数让我觉得缺少了一些东西。我不知道我错过了什么但是我肯定通过使用函数来消除信心。

为了建立一些信心,我想在C中尝试一些文字处理

任何人都可以提出一些中级但好的项目吗?如果你可以建议一些有用的项目,那么也很复杂。

2 个答案:

答案 0 :(得分:1)

不是很难,但你可以实现一个漂亮的CSV解析器吗?

答案 1 :(得分:1)

开始但可能有用的项目:

  • 给定一个包含C风格注释(/* ... */)的文本文件,编写一个处理器来删除文件中的注释。
    • 扩展此项以处理嵌套注释。
  • 尝试解析C风格的字符串,处理反斜杠命令。

对于更中间的项目,请考虑您感兴趣的功能域,并尝试为其编写一个简单的特定于域的语言。只处理解析语言的前端部分,并一次处理语言的一小部分。

我想您很快就会发现,对于更高级的文本处理,您需要开始查看可以帮助您进行解析的库。我认为这可以很好地研究regexp,lex / yacc,Antlr,甚至可能是Haskell / Parsec,如果你真的进入这种事情的话。无论如何,你不再只是依赖别人的文本处理器了。

希望这有帮助!