如何在不分组的情况下串联熊猫中数据框的所有行

时间:2018-08-09 21:59:51

标签: python pandas dataframe concatenation

我有一个这样的数据框

服用60毫克百忧解4年以上,服用了12天。索引句

  1   I feel the best I have felt in years.                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               
  2   "I have taken for over 7 years.                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  
  3   I slept 2 hours".                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    
  4   IT SAVED MY LIFE                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    
  5   IT SAVED MY LIFE" 

然后我要将它们串联在一个数组中。问题是也许有些句子是重复的,但我仍然想保留所有句子,这样结果是:

["I feel the best I have felt in years", "I have taken for over 7 years." , "I slept 2 hours." , "IT SAVED MY LIFE" , "IT SAVED MY LIFE"]

我已经尝试过这两个{r}中的linkthis

我也尝试过这种方法:

dfsent.groupby(['sentences']).apply(','.join)

但是由于数据框中的某些行是重复的,因此只给了其中之一。在我的例子中,给我这个:

["I feel the best I have felt in years", "I have taken for over 7 years." , "I slept 2 hours." , "IT SAVED MY LIFE" ]

预先感谢:)

1 个答案:

答案 0 :(得分:1)

如果只想在Pandas数据框中的一列中生成所有值的列表(无论是否唯一),则更简单的方法是使用.tolist()方法。

因此,dfsent['sentences'].tolist()将产生所需的输出。