撇号编码问题

时间:2019-04-18 13:13:04

标签: c# character-encoding rss rss-reader

我正在C#中创建一个控制台应用程序,以使用rss链接条的标题,图片链接,文章和说明的链接,并将其保存到SQL Server数据库中。 在对字符串进行解码以确保“标题”或“描述/摘要”中的字符(可能是撇号)从“”转换为“'”后才可以使用。当我处于以下情况时,什么是行不通的。

场景: 我从rss提要中获取文本,收到的rss标题如下: <title>Repair to &#x201C;Using OAuth for a simple command line script to access Google's data&#x201D;</title> &#x201C;应该是引号。

这就是我将其编码为UTF-8的方式

rss.Summary = EncodeText(rss.Summary);
public string EncodeText(string rssTitle)
{
        var bytes = Encoding.Default.GetBytes(rssTitle);
return Encoding.UTF8.GetString(bytes);
}

将标题或摘要编码为UTF-8后,会发生以下情况: 修复“使用OAuth获得简单的命令行脚本来访问Google的数据”吗? unicode替换(?),将替换原本应该存在的字符。 关于如何将”(撇号有一条曲线)转换为“(无曲线)的任何建议。我已经尝试过ASCII和UTF-8了,还可以使用另一种编码解码吗?特殊的问题。

0 个答案:

没有答案