无法在此处发布我的确切数据框,但下面是我的数据示例。 A列是唯一的,B是数字。
A B
x 1.222
y 3.290
z 400.99
........
以下是我对B的数据摘要。
Min. : 0.556
Mean : 458.615
Median : 151.960
Max. :23661.228
我希望将B分为不同的5组值(每组与其他4组的计数值大致相同),使用dplyr进行以下代码。
data %>%
mutate(range = cut(B, 5))
但是,我的输出显示出非常奇怪的B值(负值和非常大),如下所示。这没有意义,因为我的min是0.556并且我的数据集中没有负值。
range
(-23.1,4.73e+03]
(4.73e+03,9.46e+03]
.......
你能帮我解释一下为什么会出现这样的情况吗?之前我使用过这段代码,它适用于其他数据框架。有没有更好的方法将B划分为5个相等的值范围?