按字符匹配和字符串长度分组

时间:2019-04-18 09:33:10

标签: r python-3.x

假设我在数据框中有一个带有字符串的列。我想创建一种分组技术,以便匹配字符串的长度,然后还匹配字符串的字符以将其确认为特定组。

输出应按照以下提供的示例进行分组:

Rule                      Group
x                           1
x                           1
xx                          2
xx                          2
xy                          3
yx                          3
xx                          2
xyx                         4
yxx                         4
yyy                         5
xyxy                        6   
yxyx                        6
xyxy                        6

1 个答案:

答案 0 :(得分:2)

您可以拆分Rule,排序并粘贴回去。将结果与唯一结果相匹配将为您提供所需的东西。在R中,

v1 <- sapply(strsplit(df$Rule, ''), function(i)paste(sort(i), collapse = ''))
match(v1, unique(v1))
#[1] 1 1 2 2 3 3 2 4 4 5 6 6 6