将html字符串拆分为单独的div标签

时间:2009-09-30 09:07:49

标签: html vb.net string

我有一个充满html&的字符串读取

Dim strHml as string = "<html><head><title></title></head><body><div class="normal">Dog</div>
<div class="normal">Cat</div><div class="normal">Elephant</div><div class="normal">Giraffe</div><div class="normal"><div><p>Random Div</p></div>Lion</div><div>Wolf</div>
<div>Tiger</div></body></html>"

我想以某种方式能够拉出所有div标签及其内容 并将每个放入一个数组 已经看过分裂函数和正则表达式,但还没有明确易用的解决方案。

我稍微修改了这个以包含嵌套的div标签,但那些标签仍然需要以格式返回: -

<div class="normal"><div><p>Random Div</p></div>Lion</div>

1 个答案:

答案 0 :(得分:4)

我使用正则表达式在vb.net中对此进行了测试。

这就是你需要的吗?

Dim reg = New Regex("<div>(.*?)</div>")

        Dim matches = reg.Matches(strHml)

        For Each mat As Match In matches
            Dim s As String
            s = mat.Value
        Next mat