通过字符串的部分减少分类数据类别的数量

时间:2016-12-27 04:33:23

标签: python pandas categorization

我试图通过遍历字符串列表来对一些分类数据进行排序,并且在Python中执行更多基于文本的应用程序时,他是一个新手。我试图用一个数值来编纂一些类别,因为有一些冗余和太多的类别,但有相似的字符串表示法。我试图在列表中进行迭代,当我对条件为真的每个值进行简单打印时,函数工作正常,如下所示:

TwoKorE="Serial-Two"
lst=data['stuff'].tolist()
x=len(TwoKorE)

twolist=[]

for value in lst:

    if value[0:x]==TwoKorE:

        print(value)

但是,我想在列表twolist中附加一个新的分类变量,类似如下:

TwoKorE="Serial-Two"
lst=data['stuff'].tolist()
x=len(TwoKorE)

twolist=[]

for value in lst:

    if value[0:x]==TwoKorE:

        twolist.append(1)

我做错了什么?任何反馈都将非常感谢!

0 个答案:

没有答案