有谁知道如何使用C / C ++来计算数据的条纹?条纹的定义是偏离平均值的偏差(即平均数值数据条纹。感谢您的帮助。
[编辑]从我们公司的首席软件架构师,这里是统计测量的要求。有人可以根据建筑师对数据条纹的定义来定义统计公式吗? - 2013年2月19日上午8:00
相等数字是连胜。 1,2,3,3,3,4,5的条纹为7。
案例A:1,2,3,4,5,6,7,8,9,10,11,12,13最长连续13条。案例B:1,2,3,4,5,6,7,3,8,9,10,11,12的最长条纹为7,第二条较小条纹为6。
案例C:1,2,3,4,5,6,7,1,2,3,4,5,6的最长条纹为7,第二条较小条纹为6。
案例D:1,2,3,4,5,6,7,1,2,3,1,2,1的最长条纹为7条,第二条较小条纹为3条,第三条最小条纹2
案例E:1,2,3,4,5,6,7,6,5,4,1,2,3的最长条纹为7,第二条较小条纹为3。
案例F:1,2,3,4,5,6,7,6,5,4,3,2,1的最长条纹为7,没有较小的条纹。
案例A - F按“排序最多到最少排序”的顺序排列,但都具有相同长度的最长条纹。使用条纹长度的平均值是不合适的:
A:平均值= 13/1 = 13
B:平均值=(7 + 6)/ 2 = 6.5
C:平均值=(7 + 6)/ 2 = 6.5
D:平均=(7 + 3 + 2)/ 3 = 4
E:平均值=(7 + 3)/ 2 = 5
F:平均值= 7/1 = 7
考虑非条纹(将其计为1):
A:平均值= 13/1 = 13
B:平均值=(7 + 6)/ 3 = 4.3
C:平均值=(7 + 6)/ 2 = 6.5
D:平均值=(7 + 3 + 2 + 1)/ 4 = 3.25
E:平均=(7 + 1 + 1 + 1 + 3)/ 5 = 2.6
F:平均=(7 + 1 + 1 + 1 + 1 + 1 + 1)/ 7 = 1.85
变量R可用于表示与特定条纹的平均值有多少偏差。根据所公开的实施例,条纹的水平不仅可以定义在距离平均值的(整数*偏差)距离中,还可以定义为(整数*分数偏差)距离。为此,可以使用可变R因子。 R因子以偏差的一部分表示两个连续R-水平之间的间隔。通过改变R因子,可以根据需要对条纹进行排序。但是,也应考虑条纹的“可信度”,并将其纳入排名机制。条纹内的偏差是衡量数据在条纹内交错的明显标准。良好的条纹应该不那么交错,换句话说,偏差较小。由于这个原因,非常高水平的条纹被认为是好的,即使它的偏差超过通常所希望的偏差。因此,虽然水平R对排名产生积极影响,但条纹内的偏差对其产生负面影响。
答案 0 :(得分:2)
很抱歉,如果这是基础,但我从图像处理的角度来看这个。
我在分析散点图时看到的一个更有趣的方法是“图论理论断裂”或简单地由Tukey提出的“scagnostics”(散点图诊断),后来由Wilkinson编写。除了“stringiness”之外,还有其他一些有趣的形状/簇标识符。
如果您的数据是2空间或3空间,有一些图像处理算法可以识别数据条纹,但我必须看到一些示例数据图/图像,以提供任何进一步的建议。 / p>
答案 1 :(得分:1)
根本不清楚你对此措施的要求。如果你不关心条纹内容,你可以使用条纹长度的平方和除以总长度的平方。该测量值总是在0和1之间。如果整个序列是单条纹,那么它将正好为1;如果它主要是一条长条纹,则为1,如果它根本没有条纹,则为1 /长度。对于您的情况,此度量标准为
A: Average = 13²/13² = 1.0000
B: Average = (7²+6²)/13² = 0.5030
C: Average = (7²+6²)/13² = 0.5030
D: Average = (7²+3²+2²+1²)/13² = 0.3728
E: Average = (7²+1²+1²+1²+3²)/13² = 0.3609
F: Average = (7²+1+1+1+1+1+1)/13² = 0.3254