所以,它就是这样的。
我有这个文件,其中包含我放入数组的URL列表。
我必须编写一些代码来从这些网址中提取域名。
但这些网址的格式并不确定。他们可能有“http://”或“https://”或“www。”在前面,或者只是以“google.com / ...”开头。至于后面部分,我必须在“.com”或“.gov”等之后立即切断。
我不能为我的生活弄清楚如何编码。
答案 0 :(得分:-1)
您可以拆分字符串并获取域的根名称。
我建议你尝试像这样的正则表达式
(/^http?\:\/\/([^\/?#]+)(?:[\/?#]|$)/i);
(/^https?\:\/\/([^\/?#]+)(?:[\/?#]|$)/i);
(/^https?\:\/\/(?:www\.)?([^\/?#]+)(?:[\/?#]|$)/i);