Question

我是一名大学生，最近开始从事数据科学项目。

现在，我正在使用一个数据集，其中包含每个种族组的百分比：白人，黑人，亚洲人，美洲原住民和西班牙裔。

其中一些列的NaN值（对于所有列），所以我使用100-（总和（其他百分比））或在python中使用：

def white_rate(lst):
    for i in range(len(lst)):
        if lst[i] is None:
            lst[i] = 100 - (ca_data.share_black[i]+ca_data.share_native_american[i]+
                           ca_data.share_asian[i]+ca_data.share_hispanic[i])

其中ca_data是数据集，share _...是每列的名称。

当我这样做时，我发现百分比之和超过100％（这是我所期望的）

在这种情况下，考虑NaN值的更好方法是什么？

还可以编写一个 def（）来计算所有种族组的Nan值吗？（例如defcalculate_percentage_makeup将有一个数字列表作为参数，并检查列表中是否有任何元素具有Nan值；如果是，它将执行一些算术以获得百分比）

如何使用NaN值估算种族群体的百分比

0 个答案: