我正在开展一个关于从文件加载数据和计算基本统计数据(均值,方差)的项目。
该文件有20k行,每行有23列。 该文件如下:
person_id range1 value1 range2 value2 ... range11 value11
person_id可能有也可能没有范围内的值,并且同一person_id可能出现在文件的不同行,因为它可能在同一范围内具有不同的值。
我需要计算每个范围内每个人的均值和方差。结果应该是
person_id range1_mean range1_variance range2_mean range2_variance ...
我的问题:
在进行计算之后,如何确保我不会遗漏任何数据并获得正确和方差的正确结果?
我发现有些人(超过20人)的平均值不同但方差相同。
答案 0 :(得分:0)
如果您想检查您在C#中编码的公式是否正确,在检查一个给定文件的结果时,我建议您使用其他工具。使用一个称为可靠的,以便交叉检查计算的统计数据。
例如,您可以使用Excel作为参考工具。