假设我在数据框中有一个带有字符串的列。我想创建一种分组技术,以便匹配字符串的长度,然后还匹配字符串的字符以将其确认为特定组。
输出应按照以下提供的示例进行分组:
Rule Group
x 1
x 1
xx 2
xx 2
xy 3
yx 3
xx 2
xyx 4
yxx 4
yyy 5
xyxy 6
yxyx 6
xyxy 6
答案 0 :(得分:2)
您可以拆分Rule
,排序并粘贴回去。将结果与唯一结果相匹配将为您提供所需的东西。在R中,
v1 <- sapply(strsplit(df$Rule, ''), function(i)paste(sort(i), collapse = ''))
match(v1, unique(v1))
#[1] 1 1 2 2 3 3 2 4 4 5 6 6 6