此代码为“http://ahaliagroup.com/ahh/abc”
\b(?:https?://|www)\S+\b
给了我
http://ahaliagroup.com/ahh/abc
我想获取URL匹配,仅包含第一级路径。需要帮助
例如
http://ahaliagroup.com/ahh/abc - false
http://ahaliagroup.com/ahh/ - 匹配
http://ahaliagroup.com/ahh - 匹配
答案 0 :(得分:3)
将非空格序列(\S+
)替换为明确表示斜杠和非斜杠序列的模式。这将控制斜杠出现次数:
\b(?:https?:\/\/|www)[^\/\s]+\/[^\/\s]+\/?(?!\S)