在Julia DataFrames包中测试DataFrame中的值是否为NA的正确方法是什么?
我已经发现typeof(var) == NAtype
有效,但有更优雅的方式吗?
答案 0 :(得分:10)
使用typeof(var) == NAtype
这是很尴尬的,特别是因为它没有矢量化。
测试NA
值的规范方法是使用名为isna
的(向量化)函数。
让我们在NA
列中生成一些B
个值的玩具数据框:
julia> using DataFrames
julia> df = DataFrame(A = 1:10, B = 2:2:20)
10x2 DataFrame
| Row | A | B |
|-----|----|----|
| 1 | 1 | 2 |
| 2 | 2 | 4 |
| 3 | 3 | 6 |
| 4 | 4 | 8 |
| 5 | 5 | 10 |
| 6 | 6 | 12 |
| 7 | 7 | 14 |
| 8 | 8 | 16 |
| 9 | 9 | 18 |
| 10 | 10 | 20 |
julia> df[[1,4,8],symbol("B")] = NA
NA
julia> df
10x2 DataFrame
| Row | A | B |
|-----|----|----|
| 1 | 1 | NA |
| 2 | 2 | 4 |
| 3 | 3 | 6 |
| 4 | 4 | NA |
| 5 | 5 | 10 |
| 6 | 6 | 12 |
| 7 | 7 | 14 |
| 8 | 8 | NA |
| 9 | 9 | 18 |
| 10 | 10 | 20 |
现在让我们假装我们不知道DataFrame的内容,并询问以下问题:
列
B
是否包含NA
值?
typeof
方法不起作用,在这里:
julia> typeof(df[:,symbol("B")]) == NAtype
false
isna
功能更合适:
julia> any(isna(df[:,symbol("B")]))
true