我有一个充满html&的字符串读取
Dim strHml as string = "<html><head><title></title></head><body><div class="normal">Dog</div>
<div class="normal">Cat</div><div class="normal">Elephant</div><div class="normal">Giraffe</div><div class="normal"><div><p>Random Div</p></div>Lion</div><div>Wolf</div>
<div>Tiger</div></body></html>"
我想以某种方式能够拉出所有div标签及其内容 并将每个放入一个数组 已经看过分裂函数和正则表达式,但还没有明确易用的解决方案。
我稍微修改了这个以包含嵌套的div标签,但那些标签仍然需要以格式返回: -
<div class="normal"><div><p>Random Div</p></div>Lion</div>
答案 0 :(得分:4)
我使用正则表达式在vb.net中对此进行了测试。
这就是你需要的吗?
Dim reg = New Regex("<div>(.*?)</div>")
Dim matches = reg.Matches(strHml)
For Each mat As Match In matches
Dim s As String
s = mat.Value
Next mat