最快的HTML解析算法的时间复杂度是多少?我需要用Big O表示法

时间:2017-01-20 08:14:57

标签: algorithm parsing

正如标题所说,我需要知道最快的HTML解析算法的时间复杂性。

更新:我需要从HTML代码创建DOM树的复杂性,而不仅仅是解析它。

1 个答案:

答案 0 :(得分:4)

HTML DOM构造应该是正确嵌套输入的线性时间。然而,AngleSharp声称要实现的Html5算法需要通过所谓的“采用代理算法”(AAA)来特定处理不正确嵌套的内容,这需要通过一堆未封闭的格式化元素进行线性搜索。虽然尝试限制损坏(有些历史记录请参见this W3C discussion thread),但可以制作一个算法需要二次时间的HTML文档。