describe()返回“错误:UndefVarError:描述未定义”

时间:2019-04-25 21:21:08

标签: dataframe julia

我从SQL数据库中将一个表导入了一个数据框,现在我正试图通过describe()获取有关该数据框的统计信息。我也尝试过head()。两者都返回错误"ERROR: UndefVarError: describe not defined"

我已经添加并导入了DataFrames程序包来解决该问题,但这没有用。

这是我导入数据框的方式:

using Pkg

Pkg.add("ODBC")

Pkg.add("DataFrames")

using ODBC, DataFrames

db = ODBC.DSN(connection_string)

query = ODBC.query(db, "SELECT * FROM table")

df = DataFrame(query)

describe(df)

我期望得到类似于describe()head() Python函数的结果。我希望在运行head(df)之后可以看到列标签和前几行。在运行describe(df)之后,我希望每个列标签的最小值,最大值,平均值,计数等。

1 个答案:

答案 0 :(得分:1)

这里有first而不是头像。请参见下面的代码以获取示例:

julia> using DataFrames

julia> df = DataFrame(a=1:5,b=6:10)
5×2 DataFrame
│ Row │ a     │ b     │
│     │ Int64 │ Int64 │
├─────┼───────┼───────┤
│ 1   │ 1     │ 6     │
│ 2   │ 2     │ 7     │
│ 3   │ 3     │ 8     │
│ 4   │ 4     │ 9     │
│ 5   │ 5     │ 10    │

julia> first(df,3)
3×2 DataFrame
│ Row │ a     │ b     │
│     │ Int64 │ Int64 │
├─────┼───────┼───────┤
│ 1   │ 1     │ 6     │
│ 2   │ 2     │ 7     │
│ 3   │ 3     │ 8     │

julia> describe(df)
2×8 DataFrame
│ Row │ variable │ mean    │ min   │ median  │ max   │ nunique │ nmissing │ eltype   │
│     │ Symbol   │ Float64 │ Int64 │ Float64 │ Int64 │ Nothing │ Nothing  │ DataType │
├─────┼──────────┼─────────┼───────┼─────────┼───────┼─────────┼──────────┼──────────┤
│ 1   │ a        │ 3.0     │ 1     │ 3.0     │ 5     │         │          │ Int64    │
│ 2   │ b        │ 8.0     │ 6     │ 8.0     │ 10    │         │          │ Int64    │