HTML Agility Pack从输入中剥离自闭标签

时间:2012-04-17 09:07:37

标签: c# asp.net .net html-agility-pack

这就是我创建复选框的方式:

HtmlInputCheckBox checkbox = new HtmlInputCheckBox();
checkbox.ID = _Data.ControlID;
checkbox.Attributes.Add("class", "checkbox");
checkbox.Attributes.Add("autocomplete", "off");
sReplacementString = element.RenderToString();

RenderToString是执行此操作的扩展程序:

public static string RenderToString(this Control control)
{
    StringBuilder sb = new StringBuilder();
    using (StringWriter writer = new StringWriter(sb))
    {
        using (HtmlTextWriter htmlWriter = new HtmlTextWriter(writer))
        {
            control.RenderControl(htmlWriter);
        }
    }
    return sb.ToString();
}

这会在输入上产生一个带有结束标记的字符串,我可以在调试时看到它。

<input name="ttWBF_1" type="checkbox" id="ttWBF_1" autocomplete="off" class="checkbox" />

然后使用Agility Pack将其添加到HTML中:

HtmlNode temp = doc.CreateElement("temp");
temp.InnerHtml = sReplacementString;
HtmlNode current = inputNode;

foreach (HtmlNode child in temp.ChildNodes)
{
    inputNode.ParentNode.InsertAfter(child, current);
    current = child;
}
inputNode.ParentNode.RemoveChild(inputNode);

然而,在HTML中,复选框的输入标记缺少其自动关闭斜杠,因此无法通过WC3验证。

<input name="ttWBF_1" type="checkbox" id="ttWBF_1" autocomplete="off" class="checkbox">

我的文本框以相同的方式生成。使用敏捷包将HTML添加到页面时,看起来好像迷路了。

如何防止这种情况?

4 个答案:

答案 0 :(得分:13)

尝试设置“OptionWriteEmptyNodes”标志:

HtmlDocument doc = new HtmlDocument();
doc.OptionWriteEmptyNodes = true;

// ....

<强>更新

由于我的原始答案被拒绝,这是另一种可能的解决方案。

在呈现之前,您是否将正确的DOCTYPE传递给HTML文档?请查看此SO问题,了解如何插入DOCTYPE:Add a doctype to HTML via HTML Agility pack

答案 1 :(得分:3)

最后,我很难说我用正则表达式来处理HTML以添加mising的自动关闭标记。我希望有一个更好的解决方案,因为这是hacky而不是未来的证明 - 必须为每个需要纠正的标签添加它:

sXHTML = Regex.Replace(sXHTML, "<input(.*?)>", "<input $1 />");

答案 2 :(得分:2)

在创建文档节点时包含此内容,它应解决您的问题:

if (HtmlNode.ElementsFlags.ContainsKey("input"))
{   HtmlNode.ElementsFlags["input"] = HtmlElementFlag.Closed;}
else
{   HtmlNode.ElementsFlags.Add("input", HtmlElementFlag.Closed);}

原始答案: Image tag not closing with HTMLAgilityPack

答案 3 :(得分:1)

您是否尝试忽略agiliy pack中的节点? 例如,此行将告诉html agility pack忽略更改此节点。

  HtmlNode.ElementsFlags.Remove("meta");