我需要在HTML文本中读取INI文本,并使用Visual Basic 2010获取INI的每个部分。
但它在网站内部,它包含HTML标签之前和之后,甚至内部,如下所示:
... more HTML
<div ... >
[inipart1]<br />
param1=1<br />
param2=text<br />
param3=Yes<br />
param4=link<br />
[inipart2]<br />
param1=1<br />
param2=text<br />
param3=Yes<br />
param4=link
</div>
... more HTML
我需要删除所有HTML部分(所有HTML部分之前和之后)并将INI部分读取为任何其他INI文件;我需要把它变成这个:
[inipart1]
param1=1
param2=text
param3=Yes
param4=link
[inipart2]
param1=1
param2=text
param3=Yes
param4=link
任何人都可以帮助我吗?非常感谢。
答案 0 :(得分:1)
试试这个:
public string StripHtml(string text)
{
return Regex.Replace(text, @"<(.|\n)*?>", "");
}
PS:您必须包含System.Text.RegularExpressions命名空间
答案 1 :(得分:1)
如果您可以确定INI值或参数不包含任何大于或小于符号,则可以编写一个过滤掉所有HTML标记的正则表达式。