我正在学习Julia,将其用作R和Python的替代品。
我有一个Python声明:
df = pd.read_csv('{0}/{1:03.0f}.csv'.format(directory, int(id)))
正在使用
filename = length(string(id)) == 1 ? "00"*string(id) :
length(string(id)) == 2 ? "0"*string(id) : string(id)
df = readtable(directory*"/"*filename*".csv")
我非常喜欢这个,但有更简单的方法吗?
与Python类似,我可以使用df.describe()获取数据帧统计信息的摘要(R)。朱莉娅还有同等的东西吗?
答案 0 :(得分:3)
sprintf
是最紧凑的,但仅供参考,还有lpad
和rpad
。
答案 1 :(得分:2)
您可以像这样使用@sprintf
宏:
julia> @sprintf("%s/%03d.csv","foo",1)
"foo/001.csv"
您可以使用describe
函数获取DataFrame的摘要:
julia> using RDatasets
julia> iris = data("datasets","iris");
julia> describe(iris)
Min 1.0
1st Qu. 38.25
Median 75.5
Mean 75.5
3rd Qu. 112.75
Max 150.0
NAs 0
NA% 0.0%
Sepal.Length
Min 4.3
1st Qu. 5.1
Median 5.8
Mean 5.843333333333332
3rd Qu. 6.4
Max 7.9
NAs 0
NA% 0.0%
Sepal.Width
Min 2.0
1st Qu. 2.8
Median 3.0
Mean 3.0573333333333337
3rd Qu. 3.3
Max 4.4
NAs 0
NA% 0.0%
Petal.Length
Min 1.0
1st Qu. 1.6
Median 4.35
Mean 3.758000000000001
3rd Qu. 5.1
Max 6.9
NAs 0
NA% 0.0%
Petal.Width
Min 0.1
1st Qu. 0.3
Median 1.3
Mean 1.1993333333333331
3rd Qu. 1.8
Max 2.5
NAs 0
NA% 0.0%
Species
Length 150
Type UTF8String
NAs 0
NA% 0.0%
Unique 3