我希望能够实现一个数组,将一个用户的推文连同他们的标签连接起来
train = [
(['hurt','pain','shock'],'depressed'),
(['cut','harm','anxious'],'depressed'),
(['hurt','tears','stab'],'depressed'),
(['joy','smile','neutral'],'not'),
(['relax','enjoy','laugh'],'not'),
]
我尝试将它们扩展到数组中,其中alltweets包含用户拥有的所有推文,并且cleantweets是处理后的推文,将用于培训。
while i < len(alltweets) or len(alltweets) < 0:
try:
if (not alltweets[i].retweeted) and ('RT @' not in alltweets[i].text) and ('\ufe0f' not in alltweets[i].text):
print("cleaning depressed:"+ p.clean(alltweets[i].text))
cleantweets.append(p.clean(alltweets[i].text))
i+=1
except UnicodeEncodeError:
i+=1
pass
print (cleantweets)
train.extend((cleantweets,'depressed'))
print ("TRAINING")
print (train)
x+=1
但不幸的是,它只是提供了类似的内容,其中推文和它们没有被用户分开,而只是插入到数组中。
train = [['dfasdf','asdfasdf','asdfasdf'],'depressed',['asdf','asdfasdf','adsfad,'],'depressed'
]
我通过手动附加'('和')来尝试强制执行,但它不起作用。
答案 0 :(得分:2)
你只想追加,而不是延伸:
x = []
x.append((['a', 'b'], 'depressed'))
print(x)
[(['a', 'b'], 'depressed')]
Extend将 in 中的每个项目添加到集合中。追加将您指定的任何内容添加到集合中。
因为你的元组是可迭代的,所以它将它的值添加到列表中,而不是将元组本身添加到列表中。