连接标记的数组数组

时间:2018-04-27 12:22:42

标签: python python-3.x python-2.7

我希望能够实现一个数组,将一个用户的推文连同他们的标签连接起来

train = [
(['hurt','pain','shock'],'depressed'),
(['cut','harm','anxious'],'depressed'),
(['hurt','tears','stab'],'depressed'),
(['joy','smile','neutral'],'not'),
(['relax','enjoy','laugh'],'not'),
]

我尝试将它们扩展到数组中,其中alltweets包含用户拥有的所有推文,并且cleantweets是处理后的推文,将用于培训。

    while i < len(alltweets) or len(alltweets) < 0:
        try:
            if (not alltweets[i].retweeted) and ('RT @' not in alltweets[i].text) and ('\ufe0f' not in alltweets[i].text):
                print("cleaning depressed:"+ p.clean(alltweets[i].text))
                cleantweets.append(p.clean(alltweets[i].text))

            i+=1
        except UnicodeEncodeError:
            i+=1
            pass
    print (cleantweets)
    train.extend((cleantweets,'depressed'))
    print ("TRAINING")
    print (train)
    x+=1

但不幸的是,它只是提供了类似的内容,其中推文和它们没有被用户分开,而只是插入到数组中。

     train = [['dfasdf','asdfasdf','asdfasdf'],'depressed',['asdf','asdfasdf','adsfad,'],'depressed'

]             

我通过手动附加'('和')来尝试强制执行,但它不起作用。

1 个答案:

答案 0 :(得分:2)

你只想追加,而不是延伸:

x = []
x.append((['a', 'b'], 'depressed'))
print(x)
[(['a', 'b'], 'depressed')]

Extend将 in 中的每个项目添加到集合中。追加将您指定的任何内容添加到集合中。

因为你的元组是可迭代的,所以它将它的值添加到列表中,而不是将元组本身添加到列表中。