R中的离散化和混叠

时间:2014-01-27 16:36:42

标签: r alias discretization

所以,我有一个从1到100的值的数组,我需要在为每个离散值应用别名时使其离散。例如:

  A
 10
 15
 55
 15
 70

现在,假设我想让它离散超过2个箱(因此0-50是一个箱子而51-100是另一个箱子)并且将这些箱子别名为1和2.它应该导致:

A
1
1
2
1
2

请注意,这与离散功能(包含在熵或infotheo中)不同。该函数仅计算每个bin的值的数量。

我的问题也与this one不同(标题相似)。

现在,我可以使用一系列ifs获得此结果,但我想知道是否存在更简单的方法。

1 个答案:

答案 0 :(得分:2)

您正在寻找功能cut

x <- cut(sample(1:100, 10), c(0, 50, 100))
str(x)
# Factor w/ 2 levels "(0,50]","(50,100]": 1 2 1 2 1 1 2 1 1 1