像标题一样,我在线使用了茎叶图的在线数据集。但是我不知道该怎么读。例如,在def f(iterator):
for x in iterator:
# make an HTTP request
rdd.foreachPartition(f)
和Stem 7.
行中,为什么选择Leaf .5555
? Frequency = 18
行是什么意思?
每个答案对我都很有帮助。
答案 0 :(得分:0)
这里是一个例子。
DATA LIST FREE /x1.
BEGIN DATA.
10 22 22 13 14 10 16 17 17 17
END DATA.
EXAMINE VARIABLES=x1 /PLOT STEMLEAF.
x1 Stem-and-Leaf Plot
Frequency Stem & Leaf
4.00 1 . 0034
4.00 1 . 6777
2.00 2 . 22
Stem width: 10.00
Each leaf: 1 case(s)
在这些数据中,“ Stem”是每个值的十位,而“ Leaf”是一个值。第一行有四种情况,代表数据中的值10、10、13和14。这就是“频率”为4的原因;有四种情况。最后一个中只有2个,原始数据中的两个值均为22。随着数据变大,StemLeaf图可能会更难读取,但是它们的另一个真正价值是它们的形状,这使您对分布的形状有所了解。要获得该形状的另一个视图,请让SPSS生成直方图。