VB 2010在HTML文本中读取INI

时间:2013-06-25 10:43:09

标签: html .net vb.net html-parsing

我需要在HTML文本中读取INI文本,并使用Visual Basic 2010获取INI的每个部分。

但它在网站内部,它包含HTML标签之前和之后,甚至内部,如下所示:

... more HTML
<div ... >
[inipart1]<br />
param1=1<br />
param2=text<br />
param3=Yes<br />
param4=link<br />
[inipart2]<br />
param1=1<br />
param2=text<br />
param3=Yes<br />
param4=link
</div>
... more HTML

我需要删除所有HTML部分(所有HTML部分之前和之后)并将INI部分读取为任何其他INI文件;我需要把它变成这个:

[inipart1]
param1=1
param2=text
param3=Yes
param4=link
[inipart2]
param1=1
param2=text
param3=Yes
param4=link

任何人都可以帮助我吗?非常感谢。

2 个答案:

答案 0 :(得分:1)

试试这个:

public string StripHtml(string text)
{
    return Regex.Replace(text, @"<(.|\n)*?>", "");
}

PS:您必须包含System.Text.RegularExpressions命名空间

答案 1 :(得分:1)

如果您可以确定INI值或参数不包含任何大于或小于符号,则可以编写一个过滤掉所有HTML标记的正则表达式。