我从SQL数据库中将一个表导入了一个数据框,现在我正试图通过describe()
获取有关该数据框的统计信息。我也尝试过head()
。两者都返回错误"ERROR: UndefVarError: describe not defined"
。
我已经添加并导入了DataFrames
程序包来解决该问题,但这没有用。
这是我导入数据框的方式:
using Pkg
Pkg.add("ODBC")
Pkg.add("DataFrames")
using ODBC, DataFrames
db = ODBC.DSN(connection_string)
query = ODBC.query(db, "SELECT * FROM table")
df = DataFrame(query)
describe(df)
我期望得到类似于describe()
或head()
Python函数的结果。我希望在运行head(df)
之后可以看到列标签和前几行。在运行describe(df)
之后,我希望每个列标签的最小值,最大值,平均值,计数等。
答案 0 :(得分:1)
这里有first
而不是头像。请参见下面的代码以获取示例:
julia> using DataFrames
julia> df = DataFrame(a=1:5,b=6:10)
5×2 DataFrame
│ Row │ a │ b │
│ │ Int64 │ Int64 │
├─────┼───────┼───────┤
│ 1 │ 1 │ 6 │
│ 2 │ 2 │ 7 │
│ 3 │ 3 │ 8 │
│ 4 │ 4 │ 9 │
│ 5 │ 5 │ 10 │
julia> first(df,3)
3×2 DataFrame
│ Row │ a │ b │
│ │ Int64 │ Int64 │
├─────┼───────┼───────┤
│ 1 │ 1 │ 6 │
│ 2 │ 2 │ 7 │
│ 3 │ 3 │ 8 │
julia> describe(df)
2×8 DataFrame
│ Row │ variable │ mean │ min │ median │ max │ nunique │ nmissing │ eltype │
│ │ Symbol │ Float64 │ Int64 │ Float64 │ Int64 │ Nothing │ Nothing │ DataType │
├─────┼──────────┼─────────┼───────┼─────────┼───────┼─────────┼──────────┼──────────┤
│ 1 │ a │ 3.0 │ 1 │ 3.0 │ 5 │ │ │ Int64 │
│ 2 │ b │ 8.0 │ 6 │ 8.0 │ 10 │ │ │ Int64 │