处理文本文件时“标记”文本部分

时间:2012-02-13 23:37:54

标签: c# markup text-processing

我正在开发一个业余爱好项目,将现有的标记库移植到C#/ .NET类库中。如果你熟悉Markdown,那就是一个类似的概念。

我的一个早期问题是,有一种语法可以标记一段文本以阻止其被任何其他语法规则处理,我想对此提出一些建议。

我遇到的一种方法是首先搜索这些部分,删除并用某种有意义的令牌替换它们,运行其余的处理规则,然后作为最后一步,用文本替换令牌表示。

那对他人最有意义的是什么?另外,如何生成令牌,以免您不小心创建与现有文本匹配的令牌?

任何帮助/建议表示赞赏!

PT

1 个答案:

答案 0 :(得分:0)

为什么不使用正确的解析器生成器来创建标记生成器?

你可能会在几个小时内与ANTLR一起敲打。