我有一个这样的数据框
服用60毫克百忧解4年以上,服用了12天。索引句
1 I feel the best I have felt in years.
2 "I have taken for over 7 years.
3 I slept 2 hours".
4 IT SAVED MY LIFE
5 IT SAVED MY LIFE"
然后我要将它们串联在一个数组中。问题是也许有些句子是重复的,但我仍然想保留所有句子,这样结果是:
["I feel the best I have felt in years", "I have taken for over 7 years." , "I slept 2 hours." , "IT SAVED MY LIFE" , "IT SAVED MY LIFE"]
我也尝试过这种方法:
dfsent.groupby(['sentences']).apply(','.join)
但是由于数据框中的某些行是重复的,因此只给了其中之一。在我的例子中,给我这个:
["I feel the best I have felt in years", "I have taken for over 7 years." , "I slept 2 hours." , "IT SAVED MY LIFE" ]
预先感谢:)
答案 0 :(得分:1)
如果只想在Pandas数据框中的一列中生成所有值的列表(无论是否唯一),则更简单的方法是使用.tolist()
方法。
因此,dfsent['sentences'].tolist()
将产生所需的输出。