我是Julia和DataFrames的新手。
我尝试了一些命令并按预期工作,但是此describe
不会输出,因为其中提到的一些教程应包括mean
,top 25%
等。
我在这里错过了什么吗?
答案 0 :(得分:1)
describe
函数采用关键字参数stats
,该参数指定应计算哪些统计信息。查看describe
的帮助以获取完整列表。例如,如果将stats
设置为:all
,则将计算所有摘要统计信息。这是一个示例(输出有点宽,因此您必须水平滚动列表以查看所有列):
julia> df = DataFrame(a=1:3, b='a':'c')
3×2 DataFrame
│ Row │ a │ b │
│ │ Int64 │ Char │
├─────┼───────┼──────┤
│ 1 │ 1 │ 'a' │
│ 2 │ 2 │ 'b' │
│ 3 │ 3 │ 'c' │
julia> describe(df)
2×8 DataFrame
│ Row │ variable │ mean │ min │ median │ max │ nunique │ nmissing │ eltype │
│ │ Symbol │ Union… │ Any │ Union… │ Any │ Union… │ Nothing │ DataType │
├─────┼──────────┼────────┼─────┼────────┼─────┼─────────┼──────────┼──────────┤
│ 1 │ a │ 2.0 │ 1 │ 2.0 │ 3 │ │ │ Int64 │
│ 2 │ b │ │ 'a' │ │ 'c' │ 3 │ │ Char │
julia> describe(df, stats=:all)
2×13 DataFrame
│ Row │ variable │ mean │ std │ min │ q25 │ median │ q75 │ max │ nunique │ nmissing │ first │ last │ eltype │
│ │ Symbol │ Union… │ Union… │ Any │ Union… │ Union… │ Union… │ Any │ Union… │ Nothing │ Any │ Any │ DataType │
├─────┼──────────┼────────┼────────┼─────┼────────┼────────┼────────┼─────┼─────────┼──────────┼───────┼──────┼──────────┤
│ 1 │ a │ 2.0 │ 1.0 │ 1 │ 1.5 │ 2.0 │ 2.5 │ 3 │ │ │ 1 │ 3 │ Int64 │
│ 2 │ b │ │ │ 'a' │ │ │ │ 'c' │ 3 │ │ 'a' │ 'c' │ Char │
还请注意,如果您的终端机较窄,则可能会抑制某些列的显示以适合屏幕宽度,例如我将最后一个命令的结果粘贴在狭窄的终端上:
julia> describe(df, stats=:all)
2×13 DataFrame. Omitted printing of 6 columns
│ Row │ variable │ mean │ std │ min │ q25 │ median │ q75 │
│ │ Symbol │ Union… │ Union… │ Any │ Union… │ Union… │ Union… │
├─────┼──────────┼────────┼────────┼─────┼────────┼────────┼────────┤
│ 1 │ a │ 2.0 │ 1.0 │ 1 │ 1.5 │ 2.0 │ 2.5 │
│ 2 │ b │ │ │ 'a' │ │ │ │
请注意,现在通知您省略了6列的打印。 不过,在Jupyter Notebook中这应该不是问题。