考虑R中的虹膜数据集(可通过 RDatasets 包在Julia中获得)。假设我想得到" Sepal.Length"和" Petal.Width" for Species" setosa"。在R中,我可以通过以下方式实现:
子集(iris,Species ==" setosa",select = c(Sepal.Length,Petal.Width))
朱莉娅在同一份工作中是否有类似的功能?
答案 0 :(得分:2)
using RDatasets
iris = dataset("datasets","iris") # typeof(iris) => DataFrames.DataFrame
subset=iris[iris[:Species].=="setosa",[:PetalLength,:PetalWidth]]
注释(1)参考RDatasets.jl:
为了加载
RDatasets
中包含的一个数据集 包,您需要安装DataFrames
包。 此包作为依赖项自动安装 如果您按以下方式安装RDatasets
,请RDatasets
打包:
Pkg.add("RDatasets")
注意(2):由于datasets
包中的RDatasets
属于DataFrame
类型,因此可以使用dataframesjl中的语法创建Subsets
编辑:
正如@jverzani评论的那样,using DataFramesMeta
推出了一组带有SQL
语义的宏,引导用户以更熟悉的样式编写查询语句。例如,上面的命令是@ix(iris, :Species.=="setosa", [:PetalLength,:PetalWidth])