如何从字符串中删除所有HTML格式

时间:2014-04-03 10:16:45

标签: c# php html

我目前正在使用WebClient类在WinForms应用程序中查询来自C#的php脚本。

php脚本返回以html格式化的错误,因为它们旨在显示在网页中。

示例:

<br />
<b>Error:</b> Undefined value xyz in /var/www/sdsd/sdsd/asdsd.php
<br />

响应代码可能更复杂,包含其他HTML类型。

我能做些什么来让.NET解释HTML并向我返回用户期望看到的值。 理想情况下,我希望收到"Error: Undefined value xyz in /var/www/sdsd/sdsd/asdsd.php"

3 个答案:

答案 0 :(得分:2)

有很多方法可以做到这一点,快速google返回stackoverflow - strip html tagsdotnetperls - remove html tags,我认为这样可以满足您的要求。

答案 1 :(得分:0)

你的C#脚本带回html标签的原因是因为当它读取php标签并从页面获取字符串时,它不会从html解码它。

您所做的只是将其添加到c#脚本中的hmtl字符串

string StringFromPHPPage = StringFromPHPPage.server.htmldecode();
//that decodes the html tags.

答案 2 :(得分:0)

我认为你正在寻找这样的东西:

 htmlinput =
 "<br /> <b>Error:</b> Undefined value xyz in /var/www/sdsd/sdsd/asdsd.php <br />"

 nonhtmloutput =
 Regex.Replace(htmlinput,@"\<.*?\>", String.Empty)

一个简单的正则表达式,用于清除&lt;&gt;中的任何内容括号和括号本身