为什么在pd.Series上使用转换构造时出现错误:长度不匹配

时间:2019-11-16 15:32:51

标签: python pandas python-3.7 junit-jupiter

我有一个很大的 visibility: hidden; (约250万行),有10列。我需要填充列pandas.DataFrame,我按列noshow_label对数据进行分组,如果列event_label中有一个值event_action,那么我需要粘贴no_show其他我需要粘贴True。 为此,我使用以下构造:

False

当我尝试启动此代码时,它引发了错误:

data['noshow_label'] = data.groupby('event_label')['event_action'].transform(lambda x: 'no_show' in x.values)
  

请注意:列ValueError: Length mismatch: Expected axis has 2328271 elements, new values have 2328273 elements 包含诸如event_actionno_showshow_widget之类的值。   列'event_label test_passed 123123-A`,'123123-B'...

您有任何解决办法吗?

1 个答案:

答案 0 :(得分:0)

这是数据问题,我的DataFrame在组列中具有类似'NULL'的值,当我从示例中删除它们时,问题就消失了。