如何删除重复项,但保留Pandas中重复项的第一个实例和空白单元格?

时间:2016-09-27 15:41:46

标签: python pandas dataframe

我有一个pandas DataFrame,我正在做一个groupby([' target'])。count()。这很好用。但是,对于每个组,我想要的一件事是ID列中的唯一元素的数量。

我想要做的是,对于ID列,除了任何ID值的第一个副本外都是空的(ID对于组是唯一的,所以我不必担心这个问题)。然后,groupby()。count()会给我每组中唯一ID的数量......但我不知道该怎么做。

1 个答案:

答案 0 :(得分:0)

如果你想按照你描述的方式进行,$(document).ready(function(){ if ($(window).width() >= 1){ equalHeight(); } }); $(window).resize(function(){ if ($(window).width() >= 1){ equalHeight(); } }); function equalHeight() { var tallest = 0; $('.l-post-description').each(function() { /*if ($(this).find('.article-text').height() > tallest) { tallest = $(this).height(); } */ if($(this).height() > tallest){ tallest = $(this).height(); } //$(this).find('.col .item').css('min-height', tallest + 'px'); }); console.log(tallest); $('.post-thumbnail__image').css('height', tallest + 'px'); } $(document).ready(function(){ if ($(window).width() >= 1){ equalHeightt(); } }); $(window).resize(function(){ if ($(window).width() >= 1){ equalHeightt(); } }); 方法适用于此处。它可以返回一个系列,第一次出现的ID为False,其余为True。然后,您可以将其用作掩码,将重复的ID设置为null。

请参阅:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.duplicated.html