创建一个具有最长起始子字符串的新列

时间:2018-06-06 09:10:13

标签: r string machine-learning analytics data-science

我在数据集中有2列,两个值都在chr中。 我需要创建一个具有最长起始(初始)子字符串的新列。 实施例。

A ............... B .......... C。

澳大利亚奥地利澳大利亚

Network Netconnect Net

新列名是C,我想创建它。在C列中,更新了A和B中的常用起始字符串(Austr,Net)。我的数据集中没有行为10k。

1 个答案:

答案 0 :(得分:0)

从A和B中分割单词的字符,并使用循环比较每个字符。并在新列C中附加匹配的字符。

类似list1 = [' n',' e'' t',' w'' o&# 39;,' r'' k']和list2 = [' n',' e'' t&#39 ;,' C'' O'' N'' N'' C'&#39 ;吨']

现在如果(list1 [i] == list2 [i]则list3.append(list1 [i])

并将列表3保留在第3列中。