在我的 sql server 数据库中,我有一组数据值为'A'。它有大约6000个奇数行和3个列作为x轴,y轴和z轴上的点。
我必须推导出仅有100个点的子集'B',其类似于集'A'的数据,最接近去除异常值(例如,如果3d空间中只有2个点,则应该忽略它们但是如果在某处存在一组点,则应该用一两个点来表示。)
所以,请大家帮我创建一个程序或功能。 我也尝试过网络和我自己,但没有找到一个可以实现的正确解决方案。
答案 0 :(得分:1)
您需要一种简化折线的算法。也许最受欢迎的是Douglas-Peucker algorithm
算法的目的是给出由线组成的曲线 细分,找到一个点数更少的类似曲线。
目前尚不清楚 - 如何处理异常值 - 可能需要一些平滑或其他过滤(因为D_P algo试图保留它们)