我正在C#中创建一个控制台应用程序,以使用rss链接条的标题,图片链接,文章和说明的链接,并将其保存到SQL Server数据库中。 在对字符串进行解码以确保“标题”或“描述/摘要”中的字符(可能是撇号)从“”转换为“'”后才可以使用。当我处于以下情况时,什么是行不通的。
场景:
我从rss提要中获取文本,收到的rss标题如下:
<title>Repair to “Using OAuth for a simple command line script to access Google's data”</title>
“
应该是引号。
这就是我将其编码为UTF-8的方式
rss.Summary = EncodeText(rss.Summary);
public string EncodeText(string rssTitle)
{
var bytes = Encoding.Default.GetBytes(rssTitle);
return Encoding.UTF8.GetString(bytes);
}
将标题或摘要编码为UTF-8后,会发生以下情况: 修复“使用OAuth获得简单的命令行脚本来访问Google的数据”吗? unicode替换(?),将替换原本应该存在的字符。 关于如何将”(撇号有一条曲线)转换为“(无曲线)的任何建议。我已经尝试过ASCII和UTF-8了,还可以使用另一种编码解码吗?特殊的问题。