如何使用NaN值估算种族群体的百分比

时间:2020-06-20 06:25:24

标签: python data-science data-analysis

我是一名大学生,最近开始从事数据科学项目。

现在,我正在使用一个数据集,其中包含每个种族组的百分比:白人,黑人,亚洲人,美洲原住民和西班牙裔。

其中一些列的NaN值(对于所有列),所以我使用100-(总和(其他百分比))或在python中使用:

def white_rate(lst):
    for i in range(len(lst)):
        if lst[i] is None:
            lst[i] = 100 - (ca_data.share_black[i]+ca_data.share_native_american[i]+
                           ca_data.share_asian[i]+ca_data.share_hispanic[i])

其中ca_data是数据集,share _...是每列的名称。

当我这样做时,我发现百分比之和超过100%(这是我所期望的)

在这种情况下,考虑NaN值的更好方法是什么?

还可以编写一个 def()来计算所有种族组的Nan值吗? (例如defcalculate_percentage_makeup将有一个数字列表作为参数,并检查列表中是否有任何元素具有Nan值;如果是,它将执行一些算术以获得百分比)

0 个答案:

没有答案