标签: c# html parsing text
我有一些td元素,其中包含一些文字,有些还包含br和span元素。
br
span
我想只保留该文字。对于那里有 的人,我使用正则表达式(<[^>]+>| )来删除它,但在包含更多内容的td元素中,它不是够了。
 
<[^>]+>| 
td
当我打印tds的InnerHTML时,它看起来像这样 - 上面 - <td>没有附加内容,下面是:
<td>
删除除文本以外的所有内容的方法是什么?