我在System.Uri
课程中遇到了意外行为。
创建System.Uri
的实例且UrlString
包含某些模式(如...
,...#
或.#
时,System.Uri
会移除所有重复的.
个字符。
这很奇怪,但我相信这种行为是基于RFC 2396的。
当我尝试从此网址下载HTML时,问题就出现了:http://www.submarino.com.br/produto/1/23853463/mundo+segundo+steve+jobs,+o:+as+frases+mais+inspiradoras+ ...
并System.Uri
删除所有重复的.
。由于网站无法识别“新网址”,因此会重定向到原始网址。然后抛出“System.Net.WebException:尝试了太多自动重定向”,并且永远不会到达页面。
我该如何解决这个问题?
答案 0 :(得分:1)
您可以使用反射删除该特定属性。在Uri
来电之前使用此功能:
MethodInfo getSyntax = typeof(UriParser).GetMethod("GetSyntax", System.Reflection.BindingFlags.Static | System.Reflection.BindingFlags.NonPublic);
FieldInfo flagsField = typeof(UriParser).GetField("m_Flags", System.Reflection.BindingFlags.Instance | System.Reflection.BindingFlags.NonPublic);
if (getSyntax != null && flagsField != null)
{
foreach (string scheme in new[] { "http", "https" })
{
UriParser parser = (UriParser)getSyntax.Invoke(null, new object[] { scheme });
if (parser != null)
{
int flagsValue = (int)flagsField.GetValue(parser);
// Clear the CanonicalizeAsFilePath attribute
if ((flagsValue & 0x1000000) != 0)
flagsField.SetValue(parser, flagsValue & ~0x1000000);
}
}
}
已向Connect before报告。