C#Parse html字符串标记文本

时间:2013-04-24 21:46:46

标签: c# html wpf parsing

我想解析一个HTML字符串,如:

<b><a href="/wiki/Schizophrenie" title="Schizophrenie">Schizophrenie</a></b> ist eine schwere psychische Erkrankung. Sie

    <h2 class="sectionedit2" id="zu_treffende_massnahmen">zu treffende Maßnahmen</h2>
<div class="level2">
<ul><li class="level1"><div class="li">An- und Abfahrtswege freihalten; Einweisung nachrückender Kräfte, evtl. Einbahnregelung vorsehen</div>

这样所有Text都会获得一些额外的字体样式元素(<font style = "color:red;">..</font>),如:

<b><a href="/wiki/Schizophrenie" title="Schizophrenie"><font style = "color:red;">Schizophrenie</font></a></b><font style = "color:red;"> ist eine schwere psychische Erkrankung. Sie</font>

<h2 class="sectionedit2" id="zu_treffende_massnahmen"><font style = "color:red;">zu treffende Maßnahmen</font></h2>
<div class="level2">
<ul>
<li class="level1"><div class="li"><font style = "color:red;"> An- und Abfahrtswege freihalten; Einweisung nachrückender Kräfte, evtl. Einbahnregelung vorsehen</font></div>

有一种简单的方法吗?

1 个答案:

答案 0 :(得分:0)

如果您要制作html查看器或编辑器 - avalonedit可以这样做:

http://www.codeproject.com/Articles/42490/Using-AvalonEdit-WPF-Text-Editor

它已经为html定义了一个syntaxhighlight定义 - 真是一个很好的控件。

但如果这是自己做的挑战 - 你可以看到如何从这里开始:

http://khason.net/blog/richtextbox-syntax-highlighting/