如何在不删除DOCTYPE的情况下解析HTML

时间:2018-06-19 21:53:36

标签: html xml xml-parsing

有人可以帮助我将HTML字符串格式化为正确缩进的HTML字符串吗?

我当前正在使用此代码:

textBoxHTML.Text = System.Xml.Linq.XElement.Parse(textBoxHTML.Text).ToString();

但是,上面的代码从第一行中删除了DOCTYPE。

以下是解析前的HTML:

<!DOCTYPE html>
<html lang="en">
  <head>

  </head>
  <body>    

  </body>
</html>

解析后是HTML:

<html lang="en">
  <head></head>
  <body></body>
</html>

如何格式化HTML的任何字符串,以便不删除DOCTYPE?是否可以使用XML模式来完成此任务?

谢谢

0 个答案:

没有答案