IS String是有效的URL或NOT

时间:2013-11-15 09:08:31

标签: c# uri

我正在使用带有此代码的.net 2010 c#windows应用程序:检查有效Uri是否

代码:

static bool IsValidUrl(string urlString)
{
    Uri uri;
    return Uri.TryCreate(urlString, UriKind.Absolute, out uri)
        && (uri.Scheme == Uri.UriSchemeHttp
         || uri.Scheme == Uri.UriSchemeHttps
         || uri.Scheme == Uri.UriSchemeFtp
         || uri.Scheme == Uri.UriSchemeMailto
         );
}

问题:如果我验证了这个http://http://www.Google.com我得到了它的有效但是当我尝试使用IE时它没有显示任何网站。

有没有办法找出String是否有效uri? (没有使用正则表达式和互联网访问)

3 个答案:

答案 0 :(得分:5)

它不是无效的URI,甚至是无法工作的URI:您可以在浏览器的某个地方使用它,其中有一台名为“http”的本地计算机(或者如果您将Hosts文件设置为调用计算机)这一点)。

问题在于完全正确的URI http://http://www.Google.com,它会以http://http//www.Google.com的形式正常使用,因为我们通常不会在主机之后包含:,除非我们'重新包括端口号,将无法工作,因为它找不到名为“http”的机器。

现在,即使这有时会起作用,但它当然不会一直有效。所以它与URI http://www.thisdoesnotexistbecauseijustmdeitup.com/的问题不同。

如果你还需要检测那个案例,那么除了连接互联网之外别无他法。

如果您需要检测全局工作的URI,而不仅仅是在特定的LAN上:

static bool IsGloballyUsableWebMailorFtpUrl(string urlString)
{
  Uri uri;
  if(!Uri.TryCreate(urlString, UriKind.Absolute, out uri))
    return false;
  if(uri.Scheme != Uri.UriSchemeHttp
     && uri.Scheme != Uri.UriSchemeHttps
     && uri.Scheme != Uri.UriSchemeFtp
     && uri.Scheme != Uri.UriSchemeMailto)
     return false;
  string host = uri.Host;
  IPAddress ip;
  if(!IPAddress.TryParse(host, out ip))//if we don't have an IP address in the host part.
    return host.Contains('.') && !host.EndsWith(".local", StringComparison.OrdinalIgnoreCase); // Does the domain have at least one period
                                                   // And not the "local" binding used on many
                                                   // Private networks
  var octets = ip.GetAddressBytes();
  if(octets.Length == 4)
    switch(octets[0])//We've an IPv4 IP address, check it's not reserved.
    {
      case 0: case 10: case 127:
        return false;
      case 128: case 191:
        return octets[1] != 0;
      case 169:
        return octets[1] != 254;
      case 172:
        return octets[1] < 16 || octets[1] > 31;
      case 192:
        return octets[1] != 168 && (octets[1] != 0 || octets[2] != 0);
      case 223:
        return octets[1] != 255 && octets[2] != 255;
      default:
        return true;
    }
  else
    {  //We've an IPv6 IP address, check it's not reserved.
      if(IPAddress.HostToNetworkOrder(1) != 1)
        octets = octets.Reverse().ToArray();
      var ipInt = new BigInteger(octets);
      //Not the neatest approach, but serves
      if(ipInt < 0)
        return true;
      if(ipInt < 2)
        return false;
      if(ipInt < 281470681743360)
        return true;
      if(ipInt < 281474976710656)
        return false;
      if(ipInt < BigInteger.Parse("524413980667603649783483181312245760"))
        return true;
      if(ipInt < BigInteger.Parse("524413980667603649783483185607213056"))
        return false;
      if(ipInt < BigInteger.Parse("42540488161975842760550356425300246528"))
        return true;
      if(ipInt < BigInteger.Parse("42540488241204005274814694018844196864"))
        return false;
      if(ipInt < BigInteger.Parse("42540489429626442988779757922003451904"))
        return true;
      if(ipInt < BigInteger.Parse("42540490697277043217009159418706657280"))
        return false;
      if(ipInt < BigInteger.Parse("42540766411282592856903984951653826560"))
        return true;
      if(ipInt < BigInteger.Parse("42540766490510755371168322545197776896"))
        return false;
      if(ipInt < BigInteger.Parse("42545680458834377588178886921629466624"))
        return true;
      if(ipInt < BigInteger.Parse("42550872755692912415807417417958686720"))
        return false;
      if(ipInt < BigInteger.Parse("334965454937798799971759379190646833152"))
        return true;
      if(ipInt < BigInteger.Parse("337623910929368631717566993311207522304"))
        return false;
      if(ipInt < BigInteger.Parse("338288524927261089654018896841347694592"))
        return true;
      if(ipInt < BigInteger.Parse("338620831926207318622244848606417780736"))
        return false;
      if(ipInt < BigInteger.Parse("338953138925153547590470800371487866880"))
        return true;
      if(ipInt < BigInteger.Parse("340282366920938463463374607431768211456"))
        return false;
      return true;
    }
}

编辑:值得考虑的是你是否应该进行这项检查,如果它是最终连接到相关URI的应用程序,那么你只是通过拒绝连接到他们的局域网上的机器来惹恼用户。

答案 1 :(得分:2)

了解给定字符串是否代表有效网址的最佳方法,而不是实际测试它并记住上面的注释(可能适合给定的模式,但不是您认为正确的),是执行自定义分析。此外,您应该将bool函数替换为string(或Uri)能够纠正某些情况的函数(例如您建议的示例)。示例代码:

private void Form1_Load(object sender, EventArgs e)
{
    string rightUrl = returnValidUrl("http://http://www.Google.com");
    if (rightUrl != "")
    {
        //It is OK
    }
}

static string returnValidUrl(string urlString)
{
    string outUrl = "";
    Uri curUri = IsValidUrl(urlString);
    if (curUri != null)
    {
        string headingBit = "http://";
        if (curUri.Scheme == Uri.UriSchemeHttps) headingBit = "https://";
        if (curUri.Scheme == Uri.UriSchemeFtp) headingBit = "ftp://";
        if (curUri.Scheme == Uri.UriSchemeMailto) headingBit = "mailto:";

        outUrl = headingBit + urlString.ToLower().Substring(urlString.ToLower().LastIndexOf(headingBit) + headingBit.Length);
    }

    return outUrl;
}

static Uri IsValidUrl(string urlString)
{
    Uri uri = null;
    bool isValid = Uri.TryCreate(urlString, UriKind.Absolute, out uri)
        && (uri.Scheme == Uri.UriSchemeHttp
         || uri.Scheme == Uri.UriSchemeHttps
         || uri.Scheme == Uri.UriSchemeFtp
         || uri.Scheme == Uri.UriSchemeMailto
         );

    if (!isValid) uri = null;

    return uri;
}

可以使用以下内容:

string rightUrl = returnValidUrl("http://http://www.Google.com");
if (rightUrl != "")
{
    //It is OK
}

您必须扩展此方法以识别您需要的所有情况的有效/正确。

更新

正如通过评论所建议的那样,为了提供OP正在寻找的确切功能(其中的一个示例;只要提出的解决方案只是这个问题需要的类型的casuistic方法的一个例子),在这里你有一个更正的bool函数,考虑到发布的例子错误:

static bool IsValidUrl2(string urlString)
{
    Uri uri;
    return Uri.TryCreate(urlString, UriKind.Absolute, out uri)
        && ((uri.Scheme == Uri.UriSchemeHttp && numberOfBits(urlString.ToLower(), "http://") == 1)
         || (uri.Scheme == Uri.UriSchemeHttps && numberOfBits(urlString.ToLower(), "https://") == 1)
         || (uri.Scheme == Uri.UriSchemeFtp && numberOfBits(urlString.ToLower(), "ftp://") == 1)
         || (uri.Scheme == Uri.UriSchemeMailto && numberOfBits(urlString.ToLower(), "mailto:") == 1)
         );
}

static int numberOfBits(string inputString, string bitToCheck)
{
    return inputString.ToLower().Split(new string[] { bitToCheck.ToLower() }, StringSplitOptions.None).Length - 1;
}

澄清

完全确定给定网址是否有效的唯一方法是实际测试它;但OP说没有任何关联我所理解的纯字符串分析:这个答案到底是什么。无论如何,正如通过评论所解释的那样,这篇文章的目的只是通过以下方式展示:.NET +自定义算法(通过理解通过依赖字符串分析来实现整体适用性非常困难);我的建议解释了OP解释的具体问题(重复的“标题部分”)并依赖于他的条件。它根本不能被理解为普遍适用的,盲目可用的方法;但作为具有示例功能的一般框架(仅仅是概念证明)。

澄清2

如下面评论中与Jon Hanna的对话所示,还有第三种我不知道的选择:分析要成为的IP地址(即已经放在一起的数字,但尚未检查IP地址可用性)因此无法生成确定的IP地址生成);通过查看它,还可以确定给定字符串是有效URL地址的可能性(在预期条件下)。在任何情况下,只要被分析的IP地址不是确定的IP地址,就不能将其视为100%可靠的过程。无论如何,Jon Hanna在谈论这种替代方案的局限性方面处于比我更好的位置。

答案 2 :(得分:1)

您可以编写一个自定义函数来检查http://或初始部分是否与您编写的代码一起重复。