如何转换HTML字符,如@amp;正确的C#格式

时间:2019-02-28 12:09:45

标签: c#

如何将这些字符转换为纯文本?

  

¢,®,⢢,®和â€

当我在抓取期间从网站上获取文本并将其存储到数据库中时,会发生此问题。 但它会添加特殊字符和&相似字符。 我要删除所有这些内容。

2 个答案:

答案 0 :(得分:1)

您可以使用此:

Encoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(myvalue));

答案 1 :(得分:0)

试试这个:

public static string RemoveUTFCharactes(this string input)
{
   string output = string.Empty;
   if (!string.IsNullOrEmpty(input))
   {
      byte[] data = System.Text.Encoding.Default.GetBytes(input);
      output = System.Text.Encoding.UTF8.GetString(data);
   }
   return output;
}