opencv:如何使用kmeans()

时间:2016-03-18 19:32:13

标签: opencv k-means spherical-kmeans angle-to-euclidean-space

问题是,如何按角度聚类一些单位?问题是,kmeans运用欧几里德空间距离的概念,并不知道角度的周期性。因此,要使其工作,需要将角度转换为欧几里德空间,但保持以下为真:

  1. 近角是欧几里德空间中的近似值;
  2. 远角度远在欧几里得空间。
  3. 这意味着,90和-90是遥远的值,180和-180是相同的,170和-170是接近的(角度来自左上和右:0 - + 180,从左到下)右:0 - -180)

    我试图使用各种sin()函数,但它们都有第1点和第2点中提到的问题。大多数透视图是sin(x * 0.5f),但也存在180和-180是欧几里得远的值的问题空间。

    我找到的解决方案(通过突然的启示嘿嘿)))是将角度转换为圆上的点并将它们输入kmeans。通过这种方式,我们可以比较点之间的距离,这非常有效。

    重要的是要提及。终止标准中的Kmeans @eps以您提供给kmeans的样本单位表示。在我们的例子中,最大远点有dist 200个单位(2 *半径)。这意味着1.0f完全没问题。如果在调用kmeans()之前对样本使用cv :: normalize(samples,samples,0.0f,1.0f),请适当调整@eps。像eps = 0.01f这样的东西在这里发挥得更好。

    享受!希望这有助于某人。

    static cv::Point2f angleToPointOnCircle(float angle, float radius, cv::Point2f origin /* center */)
    {
            float x = radius * cosf(angle * M_PI / 180.0f) + origin.x;
            float y = radius * sinf(angle * M_PI / 180.0f) + origin.y;
            return cv::Point2f(x, y);
    }
    
    static std::vector<std::pair<size_t, int> > biggestKmeansGroup(const std::vector<int> &labels, int count)
    {
            std::vector<std::pair<size_t, int> > indices;
            std::map<int, size_t> l2cm;
    
            for (int i = 0; i < labels.size(); ++i)
                    l2cm[labels[i]]++;
    
            std::vector<std::pair<size_t, int> > c2lm;
            for (std::map<int, size_t>::iterator it = l2cm.begin(); it != l2cm.end(); it++)
                    c2lm.push_back(std::make_pair(it->second, it->first)); // count, group
    
            std::sort(c2lm.begin(), c2lm.end(), cmp_pair_first_reverse);
            for (int i = 0; i < c2lm.size() && count-- > 0; i++)
                    indices.push_back(c2lm[i]);
            return indices;
    }
    
    static void sortByAngle(std::vector<boost::shared_ptr<Pair> > &group,
                            std::vector<boost::shared_ptr<Pair> > &result)
    {
            std::vector<int> labels;
            cv::Mat samples;
    
            /* Radius is not so important here. */
            for (int i = 0; i < group.size(); i++)
                    samples.push_back(angleToPointOnCircle(group[i]->angle, 100, cv::Point2f(0, 0)));
    
            /* 90 degrees per group. May be less if you need it. */
            static int PAIR_MAX_FINE_GROUPS = 4;
    
            int groupNr = std::max(std::min((int)group.size(), PAIR_MAX_FINE_GROUPS), 1);
            assert(group.size() >= groupNr);
            cv::kmeans(samples.reshape(1, (int)group.size()), groupNr, labels,
                       cvTermCriteria(CV_TERMCRIT_EPS/* | CV_TERMCRIT_ITER*/, 30, 1.0f),
                       100, cv::KMEANS_RANDOM_CENTERS);
    
            std::vector<std::pair<size_t, int> > biggest = biggestKmeansGroup(labels, groupNr);
            for (int g = 0; g < biggest.size(); g++) {
                    for (int i = 0; i < group.size(); i++) {
                            if (labels[i] == biggest[g].second)
                                    result.push_back(group[i]);
                    }
            }
    }
    

1 个答案:

答案 0 :(得分:0)

我发现的解决方案是将角度平移到圆上的点并将其馈入kmeans。这样,我们就可以比较点之间的距离,并且效果很好。

重要的事情要提。终止条件中的Kmeans @eps用您馈给kmeans的样本单位表示。在我们的示例中,最大远点的距离为200个单位(2 *半径)。这意味着拥有1.0f完全可以。如果您在致电cv::normalize(samples, samples, 0.0f, 1.0f)之前将kmeans()用于样本,请适当调整@eps。像eps=0.01f这样的游戏在这里效果更好。

享受!希望这对某人有帮助。

static cv::Point2f angleToPointOnCircle(float angle, float radius, cv::Point2f origin /* center */)
{
        float x = radius * cosf(angle * M_PI / 180.0f) + origin.x;
        float y = radius * sinf(angle * M_PI / 180.0f) + origin.y;
        return cv::Point2f(x, y);
}

static std::vector<std::pair<size_t, int> > biggestKmeansGroup(const std::vector<int> &labels, int count)
{
        std::vector<std::pair<size_t, int> > indices;
        std::map<int, size_t> l2cm;

        for (int i = 0; i < labels.size(); ++i)
                l2cm[labels[i]]++;

        std::vector<std::pair<size_t, int> > c2lm;
        for (std::map<int, size_t>::iterator it = l2cm.begin(); it != l2cm.end(); it++)
                c2lm.push_back(std::make_pair(it->second, it->first)); // count, group

        std::sort(c2lm.begin(), c2lm.end(), cmp_pair_first_reverse);
        for (int i = 0; i < c2lm.size() && count-- > 0; i++)
                indices.push_back(c2lm[i]);
        return indices;
}

static void sortByAngle(std::vector<boost::shared_ptr<Pair> > &group,
                        std::vector<boost::shared_ptr<Pair> > &result)
{
        std::vector<int> labels;
        cv::Mat samples;

        /* Radius is not so important here. */
        for (int i = 0; i < group.size(); i++)
                samples.push_back(angleToPointOnCircle(group[i]->angle, 100, cv::Point2f(0, 0)));

        /* 90 degrees per group. May be less if you need it. */
        static int PAIR_MAX_FINE_GROUPS = 4;

        int groupNr = std::max(std::min((int)group.size(), PAIR_MAX_FINE_GROUPS), 1);
        assert(group.size() >= groupNr);
        cv::kmeans(samples.reshape(1, (int)group.size()), groupNr, labels,
                   cvTermCriteria(CV_TERMCRIT_EPS/* | CV_TERMCRIT_ITER*/, 30, 1.0f),
                   100, cv::KMEANS_RANDOM_CENTERS);

        std::vector<std::pair<size_t, int> > biggest = biggestKmeansGroup(labels, groupNr);
        for (int g = 0; g < biggest.size(); g++) {
                for (int i = 0; i < group.size(); i++) {
                        if (labels[i] == biggest[g].second)
                                result.push_back(group[i]);
                }
        }
}