C# - 解析xml文本和执行操作的最佳方法

时间:2011-01-24 04:12:03

标签: c# excel text parser-generator

我有一个带有xml标签的小文本字符串:

<sub>A</sub>B<sup>C</sup>

我需要解析此文本并根据标记执行操作。因此,上面的文本在我的目标应用程序中看起来像 A B C (MS Excel - 如果我粘贴它,Excel可以解析并格式化此字符串但是如果我只是输入则不能它在一个单元格中。)

在性能方面解析此类基于标记的文本的最佳方法是什么。将非常频繁地调用格式化代码,我希望尽可能减少开销。我可以想到以下几个选项:

  1. 使用索引器跟踪标签开始/结束的时间
  2. 逐个字符地解析它
  3. 使用正则表达式
  4. 将其加载到某些XML / HTML DOM Parser中并遍历节点
  5. 您认为哪一项对性能影响最小?我可以通过其他任何方式完成任务吗?

1 个答案:

答案 0 :(得分:4)

不要重新发明轮子,尤其是 do not use regular expressions

使用现有的XML解析器 您应该使用LINQ to XML。

如果你实现它并且发现它太慢,你可以切换到XmlReader,这将非常快但很烦人的工作。
记得;过早优化是万恶之源。