我有大量的xml文件,这些文件有很多数据(我现在不需要)和大量的程序。我想从最后读取xml以采取最后一个程序。 (从最后的START程序到最后的END程序以及它们之间的所有内容)
我从一开始就尝试过但效率不高,因为通过所有数据需要很长时间,并且每个程序都是最后一个,直到找到下一个数据。
我还尝试在数组中逐行读取存储,并且使用for循环从头开始搜索,但这也需要很长时间。
getElementByTagName也没用,因为我有很多开始和结束的程序,如果我必须完成所有这些程序,效率不高。
xml文件具有以下格式:
.............
.............
.............
<value>
<struct>
<member>
<name> procedureAction </name>
<value> 0 </value>
</member>
<member>
<name> mainType </name>
<value> 200 </value>
</member>
<member>
<name> subType </name>
<value> 30 </value>
</member>
<member>
<name> time </name>
<value> 1890 </value>
</member>
</struct>
</value>
.................
.................
.................
..................
<value>
<struct>
<member>
<name> procedureAction </name>
<value> 1 </value> </member>
<member>
<name> mainType </name>
<value> 200 </value>
</member>
<member>
<name> subType </name>
<value> 30 </value>
</member>
<member>
<name> time </name>
<value> 1890 </value>
</member>
</struct>
</value>
.............
.............
.............
procedureAction将值0表示为START,
procedureAction将值1设为END。
如何从最后读取xml文件? 迭代器不起作用,因为它需要固定大小的编码。
提前谢谢。
在&#34; procedureAction&#34;&#34; procedureAction&#34>时,procedureSearch函数拆分xml。找到元素名称并将该块保存在数组中的某个位置。 这是针对包含procedureAction的所有行完成的。 我试图搜索最后一个&#34; procedureAction值0&#34;在阵列中,但需要太多时间 ` private string [] procedureSearch(string inputXmlAsString){
string[] returnValue = null;
string[] split;
string startSplit = "<value><struct><member><name>procedureAction</name><value>";
string stopSplit = "</value></member></struct></value><value>";
const int MAX_COUNT = 100000;
string[] allResults = new string[MAX_COUNT];
int allResultsCounter = 0;
while (inputXmlAsString.CompareTo("") == 1) {
if (inputXmlAsString.Contains(startSplit)) {
//if the text is contained in the remaining log...
//split at the start (throw the split[0], keep split[1])
split = inputXmlAsString.Split(new string[] { startSplit }, StringSplitOptions.RemoveEmptyEntries);
string[] tempSplitter = null;
//gather the remaining
inputXmlAsString = string.Join(startSplit, split.Skip(1).ToList());
//and split the remaining at the stop
tempSplitter = inputXmlAsString.Split(new string[] { stopSplit }, StringSplitOptions.RemoveEmptyEntries);
//connect from the start to the stop
allResults[allResultsCounter] = startSplit + tempSplitter[0];
string tempComp = stopSplit;
tempSplitter = tempComp.Split(new String[] { "<value" }, StringSplitOptions.RemoveEmptyEntries);
allResults[allResultsCounter] += tempSplitter[0];
allResultsCounter++;
} else {
inputXmlAsString = "";
}//if substring exists
//Console.WriteLine("ReadLog after if: "+ readLog);
}//while readLog not null
returnValue = new string[allResultsCounter];
for (int b = 0; b < allResultsCounter; b++) {
returnValue[b] = allResults[b];
}//for
return returnValue;
}//end of procedureSearch function`
主要很简单:
string pieceOfXml = System.IO.File.ReadAllText(logPath);
const int MAX = 100000;
string[] allProcedures = new string[MAX];
int allProceduresCounter = 0;
allProcedures = procedureSearch(pieceOfXml);
结果是一个有近3000行的数组:一行的一个例子
<value><struct><member><name>procedureAction</name><value>20</value></member>
<member><value><struct><member><name>mainType</name><value>31</value></member>
<member><name>subType</name><value>0</value></member></struct></value></member>
<member><name>time</name><value>97</value></member></member></struct></value>