从Qt 5.5中的QUrl中删除`www

时间:2015-11-02 13:40:23

标签: c++ qt qurl

因此,在我的程序的另一部分,我从浏览器中读出了各种网址。 说我有http://www.example.com以及http://example.comhttps://example.com。对于浏览器,这三个网址是不同的。 对我来说,只有'基础'域(example.com)很重要。

我现在正尝试从域中删除www,但是,无法成功。我想使用提供的QUrl库来执行此操作,而不是检查字符串是否包含www.并在之后将其删除。 正如您所看到的,这更像是设计决策;)

这是我目前的申请。

的main.cpp

#include <QApplication>
#include <QDebug>
#include <QUrl>
#include <QList>

int main(int argc, char *argv[])
{
    QList<QUrl> urlList;
    urlList << QUrl("http://example.com/qwe/whoami/123#123141");

    urlList << QUrl("chrome://newtab/");
    urlList << QUrl("favorites://");
    urlList << QUrl("");

    urlList << QUrl("https://www.google.de/");
    urlList << QUrl("https://google.de/");
    urlList << QUrl("https://www.youtube.com/watch?v=XTPGpBBqwe");

    urlList << QUrl("https://youtube.com/watch?v=189273ijadzqiuwejk");
    urlList << QUrl("http://raspberrypi.stackexchange.com/questions/10371/whoisthisyo");
    urlList << QUrl("https://stackoverflow.com/questions/33478464/alfresco-custom");

    urlList << QUrl("http://localhost:3000");
    urlList << QUrl("localhost:3000");

    for (int i = 0; i < urlList.count(); i++) {
        qDebug() << "[" << i+1 << "] " << urlList[i].host();
    }


    return 0;
}

感谢您的帮助!

1 个答案:

答案 0 :(得分:3)

开箱即用,没有这样的功能。

我能想到的最佳解决方案是替换网址开头的"www." (如果存在)。

请注意,您不应删除主机中任何其他字符串"www.",甚至是网址的其余部分,因此我们会检查QUrl::host()是否以"www."开头,然后从中删除这四个字符。

另请注意,从技术上讲,这会更改主机名,从而导致您转到其他网站。 (尽管实际上,出于可用性原因,每个网站都应提供带有或不带www.子域前缀的相同内容。)此外,它可能导致某些特殊情况的完全意外结果,例如www.是甚至不是子域名:域www.com只会产生com

QUrl remove_www(QUrl url) {
    QString host = url.host();
    if (host.startsWith("www."))
        host = host.mid(4); // = remove first 4 chars
    url.setHost(host);
    return url;
}

然后使用此函数的返回值:

for (int i = 0; i < urlList.count(); i++) {
    qDebug() << "[" << i+1 << "] " << remove_www(urlList[i]);
}