在TXMLDocument中保留空格时的Delphi异常

时间:2013-05-31 21:05:41

标签: delphi dom msxml txmldocument

这是我之前发布的帖子的后续内容:String to XmlNode Delphi (or how to add an xml fragment to TXMLDocument)似乎有必要开始一个新问题......

我基本上是将格式正确的xml片段添加到现有的xmldocument中。上一个解决方案中建议的代码运行良好 - 直到 - 我将[poPreserveWhiteSpace]添加到TXMLDocument.ParseOptions。

当我删除[poPreserveWhiteSpace]时,一切正常,但不保留空格。它实际上将结束标记放在一个新行上。

以下是Target TXMLDocument的代码片段。

  StoredXMLObj := TXMLDocument.Create(self);
  StoredXMLObj.Options := [doNodeAutoCreate, doNodeAutoIndent];
  StoredXMLObj.ParseOptions := StoredXMLObj.ParseOptions + [poPreserveWhiteSpace];
  StoredXMLObj.XML.Assign(StoredXML);  //StoredXML is a TStringList with a complete XML Document
  StoredXMLObj.Active := TRUE;

我尝试过上面的Options和ParseOptions的不同组合,但我只能通过删除[poPreserveWhiteSpace]来获取代码。

触发异常的代码是第二行:

tmpNode := storedXMLObj.DocumentElement.ChildNodes[i]; // <Class> node
tmpNode.ChildNodes.Nodes[1].ChildNodes.Nodes[0].ChildNodes.Add(LoadXMLData(MissingElements[j]).DocumentElement); //TMPNode is an IXMLNode and MissingElements is a TStringList

我尝试在添加xml片段之前创建对LoadXMLData(..)的返回值的引用,并将这些ParseOptions设置为匹配,但是也没有运气。

有什么想法吗?

编辑:添加自包含示例代码以演示问题。澄清标题。 这是一些简化的代码。请注意,除非您注释掉包含[poPreserveWhitespace]的行,否则会出现异常。 ** Edit2:根据Remy的建议调整代码以保留空白。调用FormatXMLData时仍然有问题。

procedure TForm2.BitBtn2Click(Sender: TObject);
var
  FragmentXMLObj : TXMLDocument;
  StoredXMLObj : TXMLDocument;
  FragNode : IXMLNode;  //THIS SHOULD BE IXMLNODE, RIGHT?
  XMLStarting, XMLFragment, XMLMerged : TStringList;
  i : integer;
begin
//StringLists to hold xml data
  XMLStarting := TStringList.Create;  //COMPLETE XML
  XMLFragment := TStringList.Create;  //XML FRAGMENT TO INSERT INTO COMPLETE XML
  XMLMerged := TStringList.Create;    //MERGE OF THE ABOVE TWO.

//STARTING XML
  XMLStarting.Add('<?xml version="1.0" encoding="UTF-16" standalone="no"?>');
  XMLStarting.Add('<Programs>');
  XMLStarting.Add(' <Program_Group Batch_No="{12345678-1234-1234-1234-123456789ABC}" Description="FOO_824_1">');
  XMLStarting.Add('     <Program Name="PROG_1">');
  XMLStarting.Add('         <Class Name="CLASS_1">');
  XMLStarting.Add('             <Property Name="DB" RttiType="tkString">      </Property>');
  XMLStarting.Add('             <Property Name="SystemDate" RttiType="tkClass" ClassType="TXSDATE">12/30/1899</Property>');
  XMLStarting.Add('         </Class>');
  XMLStarting.Add('     </Program>');
  XMLStarting.Add(' </Program_Group>');
  XMLStarting.Add('</Programs>');

//XML DOCUMENT OBJECT
  StoredXMLObj := TXMLDocument.create(self);
  //PROBLEM LINE START
  StoredXMLObj.ParseOptions := StoredXMLObj.ParseOptions + [poPreserveWhiteSpace];
  //PROBLEM LINE END
  StoredXMLObj.Options := [doNodeAutoCreate, doNodeAutoIndent];
  StoredXMLObj.XML.Text := XMLStarting.Text;
  StoredXMLObj.Active := TRUE;

//XML FRAGMENT WITH SPACES
  XMLFragment.Add('<ParentNode>');
  XMLFragment.Add('<Property Name="VRSN" RttiType="tkString">    </Property>');
  XMLFragment.Add('<Property Name="ShowMetaData" RttiType="tkBoolean">     </Property>');
  XMLFragment.Add('</ParentNode>');

//--OLD CODE THAT RAISES EXCEPTION--
//INSERTING XML FRAGMENT INTO STARTING XML
//  FragNode := storedXMLObj.DocumentElement.ChildNodes[0];
//  FragNode.ChildNodes.Nodes[0].ChildNodes.Nodes[0].ChildNodes.Add(LoadXMLData(XMLFragment.Text).DocumentElement.ChildNodes.Nodes[0]);
//  FragNode.ChildNodes.Nodes[0].ChildNodes.Nodes[0].ChildNodes.Add(LoadXMLData(XMLFragment.Text).DocumentElement.ChildNodes.Nodes[1]);
//--OLD CODE THAT RAISES EXCEPTION--

  FragNode := storedXMLObj.DocumentElement.ChildNodes[1];
  FragmentXMLObj := TXMLDocument.Create(self);
  FragmentXMLObj.ParseOptions := FragmentXMLObj.ParseOptions + [poPreserveWhiteSpace];
  FragmentXMLObj.Options := [doNodeAutoCreate, doNodeAutoIndent];
  FragmentXMLObj.LoadFromXML(XMLFragment.Text);

  //FragNode.ChildNodes.Nodes[1].ChildNodes.Nodes[1].ChildNodes.Add(FragmentXMLObj.DocumentElement);  //this also pulls in the parent tags, which I don't want.
  for i := 0 to FragmentXMLObj.DocumentElement.ChildNodes.Count-1 do  //easier to just pull in all the nodes (including whitespace, then formatxml to cleanup).
    FragNode.ChildNodes.Nodes[1].ChildNodes.Nodes[1].ChildNodes.Add(FragmentXMLObj.DocumentElement.ChildNodes.Nodes[i]);
  FragmentXMLObj.Free;

  XMLMerged.Text := StoredXMLObj.XML.Text;
  XMLMerged.Text := FormatXMLData(XMLMerged.Text);  //UGH... FormatXMLData WIPES OUT WHITESPACE PROPERTY VALUES!!  Doesn't seem to have any settings either...
  XMLMerged.SaveToFile('c:\merged.xml');

  XMLStarting.Free;
  XMLFragment.Free;
  XMLMerged.Free;
  StoredXMLObj.Free;
end;

生成的合并XML文件...在格式化过程中,空白属性值被清除(我确实需要格式化数据,w真的很难看)。

<?xml version="1.0" encoding="UTF-16" standalone="no"?>
<Programs>
  <Program_Group Batch_No="{12345678-1234-1234-1234-123456789ABC}" Description="FOO_824_1">
    <Program Name="PROG_1">
      <Class Name="CLASS_1">
        <Property Name="DB" RttiType="tkString"/>
        <Property Name="SystemDate" RttiType="tkClass" ClassType="TXSDATE">12/30/1899</Property>
        <Property Name="VRSN" RttiType="tkString"/>
        <Property Name="ShowMetaData" RttiType="tkBoolean"/>
      </Class>
    </Program>
  </Program_Group>
</Programs>

1 个答案:

答案 0 :(得分:2)

LoadXMLData()期望输入字符串是格式良好的XML文档。我为您之前的问题提供的解决方案很有效,因为您指定了单独的XML元素,这些元素本身可以作为独立文档。但PCDATA元素本身并不是格式良好的XML文档。尝试将其包装在假元素中,例如:

tmpDoc := LoadXMLData('<Doc>' + MissingElements[j] + '</Doc>').DocumentElement;
for I := 0 to tmpDoc.ChildNodes.Count-1 do
  tmpNode.ChildNodes[1].ChildNodes[0].ChildNodes.Add(tmpDoc.ChildNodes[I]);

更新:您收到“索引越界”错误,因为您在访问ChildNodes时未考虑空白DOM节点。

鉴于你所展示的XML:

XMLStarting.Add('<?xml version="1.0" encoding="UTF-16" standalone="no"?>');
XMLStarting.Add('<Programs>');
XMLStarting.Add(' <Program_Group Batch_No="{12345678-1234-1234-1234-123456789ABC}" Description="FOO_824_1">');
XMLStarting.Add('     <Program Name="PROG_1">');
XMLStarting.Add('         <Class Name="CLASS_1">');
XMLStarting.Add('             <Property Name="DB" RttiType="tkString">      </Property>');
XMLStarting.Add('             <Property Name="SystemDate" RttiType="tkClass" ClassType="TXSDATE">12/30/1899</Property>');
XMLStarting.Add('         </Class>');
XMLStarting.Add('     </Program>');
XMLStarting.Add(' </Program_Group>');
XMLStarting.Add('</Programs>');

鉴于你所展示的代码失败了:

FragNode := storedXMLObj.DocumentElement.ChildNodes[0];
FragNode.ChildNodes.Nodes[0].ChildNodes.Nodes[0].ChildNodes.Add(LoadXMLData(XMLFragment.Text).DocumentElement.ChildNodes.Nodes[0]);

以下是真实的:

  1. storedXMLObj.DocumentElement指的是<Programs>节点。
  2. ChildNodes[0]节点引用 <Programs><Program_Group>节点之间的空白,但您希望它引用<Program_Group>节点而不是。
  3. 因此,FragNode.ChildNodes.Nodes[0]失败,因为 FragNode是一个没有子节点的纯文本节点!
  4. 您可以自己确认一下。 FragNode.NodeName'#text'FragNode.NodeTypentTextFragNode.NodeValue#$A' 'FragNode.HasChildNodes为假,FragNode.IsTextElement是真的。

    换句话说,上面的XML具有以下结构:

    ntElement 'Programs'
    |
    |_ ntText #$A' '
    |
    |_ ntElement 'Program_Group'
       |
       |_ ntText #$A'     '
       |
       |_ ntElement 'Program'
       |  |
       |  |_ ntText #$A'         '
       |  |
       |  |_ ntElement 'Class'
       |  |  |
       |  |  |_ ntText #$A'             '
       |  |  |
       |  |  |_ nElement 'Property'
       |  |  |  |
       |  |  |  |_ ntText '      '
       |  |  |
       |  |  |_ ntText #$A'             '
       |  |  |
       |  |  |_ ntElement 'Property'
       |  |  |  |
       |  |  |  |_ ntText '12/30/1899'
       |  |  |
       |  |  |_ ntText #$A'         '
       |  |
       |  |_ ntText #$A'     '
       |
       |_ ntText #$A' '
    

    希望这会让它更清晰。

    所以,为了完成你想要做的事情,你需要更像这样的东西:

    FragNode := storedXMLObj.DocumentElement.ChildNodes[1];
    FragNode.ChildNodes.Nodes[1].ChildNodes.Nodes[1].ChildNodes.Add(LoadXMLData(XMLFragment.Text).DocumentElement);
    FragNode.ChildNodes.Nodes[1].ChildNodes.Nodes[1].ChildNodes.Add(LoadXMLData(XMLFragment.Text).DocumentElement);
    

    如果要保留LoadXMLData()片段中的空格,则必须直接使用TXMLDocument,因为LoadXMLData()不允许您设置poPreserveWhiteSpace标记:

    FragmentXMLObj := TXMLDocument.Create(self);
    FragmentXMLObj.ParseOptions := FragmentXMLObj.ParseOptions + [poPreserveWhiteSpace];
    FragmentXMLObj.Options := [doNodeAutoCreate, doNodeAutoIndent];
    FragmentXMLObj.LoadFromXML(XMLFragment.Text);
    FragNode.ChildNodes.Nodes[1].ChildNodes.Nodes[1].ChildNodes.Add(FragmentXMLObj.DocumentElement);
    FragmentXMLObj.Free;
    

    为避免ChildNodes索引出现任何问题,最好使用XPath查询,这样您就可以让DOM搜索要插入片段的<Class>节点。

    无论哪种方式,您很快就会发现这不会产生非常漂亮的XML。如果您只是希望存在空格,但实际上并不需要按原样保留原始空格,那么最好禁用poPreserveWhiteSpace标志,然后在使用FormatXMLData()时使用XMLMerged.Text := FormatXMLData(StoredXMLObj.XML.Text); 正在保存最终文件:

    {{1}}