列名称作为DataFramesMeta宏中的变量

时间:2019-04-16 19:39:25

标签: julia

我正在使用 DataFramesMeta.jl 中的宏,并且希望将列名称存储在变量中。这是我的输入数据:

using DataFrames
using DataFramesMeta
using Statistics

df = DataFrame(g = ["a", "a", "b", "b"], x = 1:4)
gdf = groupby(df, :g)

colname = :x

如果我在colname中使用@select,除了返回数组而不是数据帧之外,它的工作原理是这样的:

julia> @select(df, :x)
4×1 DataFrame
│ Row │ x     │
│     │ Int64 │
├─────┼───────┤
│ 1   │ 1     │
│ 2   │ 2     │
│ 3   │ 3     │
│ 4   │ 4     │

julia> @select(df, colname)
4-element Array{Int64,1}:
 1
 2
 3
 4

如果我尝试在colname@where中使用@group_by,则会抛出方法错误:

julia> @where(df, :x .> 2)
2×2 DataFrame
│ Row │ g      │ x     │
│     │ String │ Int64 │
├─────┼────────┼───────┤
│ 1   │ b      │ 3     │
│ 2   │ b      │ 4     │

julia> @where(df, colname .> 2)
ERROR: MethodError: no method matching isless(::Int64, ::Symbol)
julia> @based_on(gdf, xavg = mean(:x))
2×2 DataFrame
│ Row │ g      │ xavg    │
│     │ String │ Float64 │
├─────┼────────┼─────────┤
│ 1   │ a      │ 1.5     │
│ 2   │ b      │ 3.5     │

julia> @based_on(gdf, xavg = mean(colname))
ERROR: MethodError: no method matching iterate(::Symbol)

是否可以在 DataFramesMeta.jl 宏中将列名作为变量传递?

1 个答案:

答案 0 :(得分:1)

尝试

@where(df, cols(colname) .> 2)

直接从文档顶部开始:https://github.com/JuliaData/DataFramesMeta.jl#with