如何将这些字符转换为纯文本?
¢,®,⢢,®和â€
当我在抓取期间从网站上获取文本并将其存储到数据库中时,会发生此问题。 但它会添加特殊字符和&相似字符。 我要删除所有这些内容。
答案 0 :(得分:1)
您可以使用此:
Encoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(myvalue));
答案 1 :(得分:0)
试试这个:
public static string RemoveUTFCharactes(this string input)
{
string output = string.Empty;
if (!string.IsNullOrEmpty(input))
{
byte[] data = System.Text.Encoding.Default.GetBytes(input);
output = System.Text.Encoding.UTF8.GetString(data);
}
return output;
}