Question

我有一个这样的数据框

服用60毫克百忧解4年以上，服用了12天。索引句

  1   I feel the best I have felt in years.                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               
  2   "I have taken for over 7 years.                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  
  3   I slept 2 hours".                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    
  4   IT SAVED MY LIFE                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    
  5   IT SAVED MY LIFE"

然后我要将它们串联在一个数组中。问题是也许有些句子是重复的，但我仍然想保留所有句子，这样结果是：

["I feel the best I have felt in years", "I have taken for over 7 years." , "I slept 2 hours." , "IT SAVED MY LIFE" , "IT SAVED MY LIFE"]

我已经尝试过这两个{r}中的link和this。

我也尝试过这种方法：

dfsent.groupby(['sentences']).apply(','.join)

但是由于数据框中的某些行是重复的，因此只给了其中之一。在我的例子中，给我这个：

["I feel the best I have felt in years", "I have taken for over 7 years." , "I slept 2 hours." , "IT SAVED MY LIFE" ]

预先感谢：）

Answer 1

如果只想在Pandas数据框中的一列中生成所有值的列表（无论是否唯一），则更简单的方法是使用.tolist()方法。

因此，dfsent['sentences'].tolist()将产生所需的输出。

如何在不分组的情况下串联熊猫中数据框的所有行

1 个答案: