我有一个带有xml标签的小文本字符串:
<sub>A</sub>B<sup>C</sup>
我需要解析此文本并根据标记执行操作。因此,上面的文本在我的目标应用程序中看起来像 A B C (MS Excel - 如果我粘贴它,Excel可以解析并格式化此字符串但是如果我只是输入则不能它在一个单元格中。)
在性能方面解析此类基于标记的文本的最佳方法是什么。将非常频繁地调用格式化代码,我希望尽可能减少开销。我可以想到以下几个选项:
您认为哪一项对性能影响最小?我可以通过其他任何方式完成任务吗?
答案 0 :(得分:4)
不要重新发明轮子,尤其是 do not use regular expressions。
使用现有的XML解析器 您应该使用LINQ to XML。
如果你实现它并且发现它太慢,你可以切换到XmlReader
,这将非常快但很烦人的工作。
记得;过早优化是万恶之源。