我需要处理html,我需要它从XHTML角度来看是有效的。例如,XHTML中的自我结束标记(例如<br>
和<hr>
)应分别为<br />
和<hr />
。
为了解决这个问题,我将HTML转换为文字,并将所有<br>
代码替换为<br />
和<hr>
- 并<hr />
。
现在问题是某些<hr>
标签具有属性。例如:
<hr width="100%" size="3" align="center" style="color: rgb(153,153,153);">
在他的情况下,替换变得更加复杂,因为我不能简单地使用
str = str.Replace("<hr>","<hr/>")
是否有一种更简单的方法,然后编写一个搜索"<hr"
每次出现的函数,然后查找以下">"
并将其替换为"/>"
?