System.Uri问题

时间:2012-04-29 00:44:05

标签: c# uri

我在System.Uri课程中遇到了意外行为。 创建System.Uri的实例且UrlString包含某些模式(如......#.#时,System.Uri会移除所有重复的.个字符。

这很奇怪,但我相信这种行为是基于RFC 2396的。

当我尝试从此网址下载HTML时,问题就出现了:http://www.submarino.com.br/produto/1/23853463/mundo+segundo+steve+jobs,+o:+as+frases+mais+inspiradoras+ ...

System.Uri删除所有重复的.。由于网站无法识别“新网址”,因此会重定向到原始网址。然后抛出“System.Net.WebException:尝试了太多自动重定向”,并且永远不会到达页面。

我该如何解决这个问题?

1 个答案:

答案 0 :(得分:1)

您可以使用反射删除该特定属性。在Uri来电之前使用此功能:

MethodInfo getSyntax = typeof(UriParser).GetMethod("GetSyntax", System.Reflection.BindingFlags.Static | System.Reflection.BindingFlags.NonPublic);
FieldInfo flagsField = typeof(UriParser).GetField("m_Flags", System.Reflection.BindingFlags.Instance | System.Reflection.BindingFlags.NonPublic);
if (getSyntax != null && flagsField != null)
{
    foreach (string scheme in new[] { "http", "https" })
    {
        UriParser parser = (UriParser)getSyntax.Invoke(null, new object[] { scheme });
        if (parser != null)
        {
            int flagsValue = (int)flagsField.GetValue(parser);
            // Clear the CanonicalizeAsFilePath attribute
            if ((flagsValue & 0x1000000) != 0)
                flagsField.SetValue(parser, flagsValue & ~0x1000000);
        }
    }
}

已向Connect before报告。