从流中读取时预先制作(x)html

时间:2011-06-25 20:23:08

标签: regex parsing stream cgi

我正在为嵌入式系统构建cgi,并且需要能够将系统信息插入到网页中。 我的计划是插入源代码xhtml并让cgi在看到FunctionCall“宏”时发挥其魔力。 如果我可以在内存中保存完整的源代码xhtml并对其执行正则表达式,那么处理此问题没有问题,但我宁愿能够在阅读时花更少的内存并处理流或块。 问题是:我必须确保我不会在“”中间块,否则正则表达式将无效。 有没有正确的替代品,或者你有什么想法,这可能会有所帮助吗?

1 个答案:

答案 0 :(得分:0)

你想要替代正则表达式是正确的,因为(X)HTML不是一种“常规”语言。

您可能会受益于HTML :: Parser的子类之一:HTML :: TokeParser,HTML :: TokeParser :: Simple,HTML :: TreeBuilder(:: Xpath)?,HTML :: TableExtract等。