我正在使用带有此代码的.net 2010 c#windows应用程序:检查有效Uri是否
代码:
static bool IsValidUrl(string urlString)
{
Uri uri;
return Uri.TryCreate(urlString, UriKind.Absolute, out uri)
&& (uri.Scheme == Uri.UriSchemeHttp
|| uri.Scheme == Uri.UriSchemeHttps
|| uri.Scheme == Uri.UriSchemeFtp
|| uri.Scheme == Uri.UriSchemeMailto
);
}
问题:如果我验证了这个http://http://www.Google.com
我得到了它的有效但是当我尝试使用IE时它没有显示任何网站。
有没有办法找出String是否有效uri? (没有使用正则表达式和互联网访问)
答案 0 :(得分:5)
它不是无效的URI,甚至是无法工作的URI:您可以在浏览器的某个地方使用它,其中有一台名为“http”的本地计算机(或者如果您将Hosts文件设置为调用计算机)这一点)。
问题在于完全正确的URI http://http://www.Google.com
,它会以http://http//www.Google.com
的形式正常使用,因为我们通常不会在主机之后包含:
,除非我们'重新包括端口号,将无法工作,因为它找不到名为“http”的机器。
现在,即使这有时会起作用,但它当然不会一直有效。所以它与URI http://www.thisdoesnotexistbecauseijustmdeitup.com/
的问题不同。
如果你还需要检测那个案例,那么除了连接互联网之外别无他法。
如果您需要检测全局工作的URI,而不仅仅是在特定的LAN上:
static bool IsGloballyUsableWebMailorFtpUrl(string urlString)
{
Uri uri;
if(!Uri.TryCreate(urlString, UriKind.Absolute, out uri))
return false;
if(uri.Scheme != Uri.UriSchemeHttp
&& uri.Scheme != Uri.UriSchemeHttps
&& uri.Scheme != Uri.UriSchemeFtp
&& uri.Scheme != Uri.UriSchemeMailto)
return false;
string host = uri.Host;
IPAddress ip;
if(!IPAddress.TryParse(host, out ip))//if we don't have an IP address in the host part.
return host.Contains('.') && !host.EndsWith(".local", StringComparison.OrdinalIgnoreCase); // Does the domain have at least one period
// And not the "local" binding used on many
// Private networks
var octets = ip.GetAddressBytes();
if(octets.Length == 4)
switch(octets[0])//We've an IPv4 IP address, check it's not reserved.
{
case 0: case 10: case 127:
return false;
case 128: case 191:
return octets[1] != 0;
case 169:
return octets[1] != 254;
case 172:
return octets[1] < 16 || octets[1] > 31;
case 192:
return octets[1] != 168 && (octets[1] != 0 || octets[2] != 0);
case 223:
return octets[1] != 255 && octets[2] != 255;
default:
return true;
}
else
{ //We've an IPv6 IP address, check it's not reserved.
if(IPAddress.HostToNetworkOrder(1) != 1)
octets = octets.Reverse().ToArray();
var ipInt = new BigInteger(octets);
//Not the neatest approach, but serves
if(ipInt < 0)
return true;
if(ipInt < 2)
return false;
if(ipInt < 281470681743360)
return true;
if(ipInt < 281474976710656)
return false;
if(ipInt < BigInteger.Parse("524413980667603649783483181312245760"))
return true;
if(ipInt < BigInteger.Parse("524413980667603649783483185607213056"))
return false;
if(ipInt < BigInteger.Parse("42540488161975842760550356425300246528"))
return true;
if(ipInt < BigInteger.Parse("42540488241204005274814694018844196864"))
return false;
if(ipInt < BigInteger.Parse("42540489429626442988779757922003451904"))
return true;
if(ipInt < BigInteger.Parse("42540490697277043217009159418706657280"))
return false;
if(ipInt < BigInteger.Parse("42540766411282592856903984951653826560"))
return true;
if(ipInt < BigInteger.Parse("42540766490510755371168322545197776896"))
return false;
if(ipInt < BigInteger.Parse("42545680458834377588178886921629466624"))
return true;
if(ipInt < BigInteger.Parse("42550872755692912415807417417958686720"))
return false;
if(ipInt < BigInteger.Parse("334965454937798799971759379190646833152"))
return true;
if(ipInt < BigInteger.Parse("337623910929368631717566993311207522304"))
return false;
if(ipInt < BigInteger.Parse("338288524927261089654018896841347694592"))
return true;
if(ipInt < BigInteger.Parse("338620831926207318622244848606417780736"))
return false;
if(ipInt < BigInteger.Parse("338953138925153547590470800371487866880"))
return true;
if(ipInt < BigInteger.Parse("340282366920938463463374607431768211456"))
return false;
return true;
}
}
编辑:值得考虑的是你是否应该进行这项检查,如果它是最终连接到相关URI的应用程序,那么你只是通过拒绝连接到他们的局域网上的机器来惹恼用户。
答案 1 :(得分:2)
了解给定字符串是否代表有效网址的最佳方法,而不是实际测试它并记住上面的注释(可能适合给定的模式,但不是您认为正确的),是执行自定义分析。此外,您应该将bool
函数替换为string
(或Uri
)能够纠正某些情况的函数(例如您建议的示例)。示例代码:
private void Form1_Load(object sender, EventArgs e)
{
string rightUrl = returnValidUrl("http://http://www.Google.com");
if (rightUrl != "")
{
//It is OK
}
}
static string returnValidUrl(string urlString)
{
string outUrl = "";
Uri curUri = IsValidUrl(urlString);
if (curUri != null)
{
string headingBit = "http://";
if (curUri.Scheme == Uri.UriSchemeHttps) headingBit = "https://";
if (curUri.Scheme == Uri.UriSchemeFtp) headingBit = "ftp://";
if (curUri.Scheme == Uri.UriSchemeMailto) headingBit = "mailto:";
outUrl = headingBit + urlString.ToLower().Substring(urlString.ToLower().LastIndexOf(headingBit) + headingBit.Length);
}
return outUrl;
}
static Uri IsValidUrl(string urlString)
{
Uri uri = null;
bool isValid = Uri.TryCreate(urlString, UriKind.Absolute, out uri)
&& (uri.Scheme == Uri.UriSchemeHttp
|| uri.Scheme == Uri.UriSchemeHttps
|| uri.Scheme == Uri.UriSchemeFtp
|| uri.Scheme == Uri.UriSchemeMailto
);
if (!isValid) uri = null;
return uri;
}
可以使用以下内容:
string rightUrl = returnValidUrl("http://http://www.Google.com");
if (rightUrl != "")
{
//It is OK
}
您必须扩展此方法以识别您需要的所有情况的有效/正确。
更新
正如通过评论所建议的那样,为了提供OP正在寻找的确切功能(其中的一个示例;只要提出的解决方案只是这个问题需要的类型的casuistic方法的一个例子),在这里你有一个更正的bool
函数,考虑到发布的例子错误:
static bool IsValidUrl2(string urlString)
{
Uri uri;
return Uri.TryCreate(urlString, UriKind.Absolute, out uri)
&& ((uri.Scheme == Uri.UriSchemeHttp && numberOfBits(urlString.ToLower(), "http://") == 1)
|| (uri.Scheme == Uri.UriSchemeHttps && numberOfBits(urlString.ToLower(), "https://") == 1)
|| (uri.Scheme == Uri.UriSchemeFtp && numberOfBits(urlString.ToLower(), "ftp://") == 1)
|| (uri.Scheme == Uri.UriSchemeMailto && numberOfBits(urlString.ToLower(), "mailto:") == 1)
);
}
static int numberOfBits(string inputString, string bitToCheck)
{
return inputString.ToLower().Split(new string[] { bitToCheck.ToLower() }, StringSplitOptions.None).Length - 1;
}
澄清
完全确定给定网址是否有效的唯一方法是实际测试它;但OP说没有任何关联我所理解的纯字符串分析:这个答案到底是什么。无论如何,正如通过评论所解释的那样,这篇文章的目的只是通过以下方式展示:.NET +自定义算法(通过理解通过依赖字符串分析来实现整体适用性非常困难);我的建议解释了OP解释的具体问题(重复的“标题部分”)并依赖于他的条件。它根本不能被理解为普遍适用的,盲目可用的方法;但作为具有示例功能的一般框架(仅仅是概念证明)。
澄清2
如下面评论中与Jon Hanna的对话所示,还有第三种我不知道的选择:分析要成为的IP地址(即已经放在一起的数字,但尚未检查IP地址可用性)因此无法生成确定的IP地址生成);通过查看它,还可以确定给定字符串是有效URL地址的可能性(在预期条件下)。在任何情况下,只要被分析的IP地址不是确定的IP地址,就不能将其视为100%可靠的过程。无论如何,Jon Hanna在谈论这种替代方案的局限性方面处于比我更好的位置。
答案 2 :(得分:1)
您可以编写一个自定义函数来检查http://或初始部分是否与您编写的代码一起重复。