从文本文件中提取字符串的一部分

时间:2016-08-10 13:34:53

标签: c++

所以,它就是这样的。

我有这个文件,其中包含我放入数组的URL列表。

我必须编写一些代码来从这些网址中提取域名。

但这些网址的格式并不确定。他们可能有“http://”或“https://”或“www。”在前面,或者只是以“google.com / ...”开头。至于后面部分,我必须在“.com”或“.gov”等之后立即切断。

我不能为我的生活弄清楚如何编码。

1 个答案:

答案 0 :(得分:-1)

您可以拆分字符串并获取域的根名称。

我建议你尝试像这样的正则表达式

(/^http?\:\/\/([^\/?#]+)(?:[\/?#]|$)/i);

(/^https?\:\/\/([^\/?#]+)(?:[\/?#]|$)/i);

(/^https?\:\/\/(?:www\.)?([^\/?#]+)(?:[\/?#]|$)/i);