使用向量来对Julia中的字符串向量中的元素进行子集化

时间:2017-04-11 18:29:16

标签: arrays string vector julia

我正在尝试使用Vector{String}Integer子集值的组合对Julia中的Vector{Integer}进行分组。我想编写一个函数,它基本上允许"asdf"[1:3]的子集,三个参数x[y:z]中的每一个都是向量或单例。

这是我到目前为止所尝试的:

function substring(x::Array{String}, y::Integer, z::Integer)
  y = fill(y, length(x))
  z = fill(z, length(x))
  substring(x, y, z)
end

function substring(x::Vector{String}, y::Vector{Integer}, z::Integer)
  y = fill(y, length(x))
  substring(x, y, z)
end

function substring(x::Vector{String}, y::Integer, z::Vector{Integer})
  z = fill(z, length(x))
  substring(x, y, z)
end

function substring(x::Vector{String}, y::Vector{Integer}, z::Vector{Integer})
  for i = 1:length(x)
    x[i] = x[i][y[i]:min(z[i], length(x[i]))]
    # If z[i] is greater than the length of x[i] 
    # return the end of the string
  end
  x
end

试图使用它:

v = string.('a':'z')
x = rand(v, 100) .* rand(v, 100) .* rand(v, 100)

substring(x, 1, 2)
# or
substring(x, 1, s)

我收到错误:

MethodError: no method matching substring(::Array{String,1}, ::Int64, ::Array{Int64,1})
Closest candidates are:
  substring(::Array{String,N}, ::Integer, !Matched::Integer) at untitled-e3b9271a972031e628a35deeeb23c4a8:2
  substring(::Array{String,1}, ::Integer, !Matched::Array{Integer,1}) at untitled-e3b9271a972031e628a35deeeb23c4a8:13
  substring(::Array{String,N}, ::Integer, !Matched::Array{Integer,N}) at untitled-e3b9271a972031e628a35deeeb23c4a8:13
  ...
 in include_string(::String, ::String, ::Int64) at eval.jl:28
 in include_string(::Module, ::String, ::String, ::Int64, ::Vararg{Int64,N}) at eval.jl:32
 in (::Atom.##53#56{String,Int64,String})() at eval.jl:50
 in withpath(::Atom.##53#56{String,Int64,String}, ::Void) at utils.jl:30
 in withpath(::Function, ::String) at eval.jl:38
 in macro expansion at eval.jl:49 [inlined]
 in (::Atom.##52#55{Dict{String,Any}})() at task.jl:60

我发现类型post addressing存在另一个Vector{String}类似错误。我的帖子还质疑对与Vector{Integer}相关的错误的回应。我相信对它的回应可能对像我这样的人来说有帮助,他们发现抽象类型的实现既新颖又困难。

2 个答案:

答案 0 :(得分:2)

如果您使用的是Julia 0.6,使用SubString.(strs, starts, ends)很容易做到:

julia> SubString.("asdf", 2, 3)
"sd"

julia> SubString.(["asdf", "cdef"], 2, 3)
2-element Array{SubString{String},1}:
 "sd"
 "de"

julia> SubString.("asdf", 2, [3, 4])
2-element Array{SubString{String},1}:
 "sd" 
 "sdf"

在Julia 0.5上,你可以做同样的事情,但你必须将字符串包装在一个向量中(即它不能作为单个标量保留):

julia> SubString.(["asdf"], [1, 2, 3], [2, 3, 4])
3-element Array{SubString{String},1}:
 "as"
 "sd"
 "df"

Julia和R之间的主要区别在于,在R中,函数通常默认为在矢量上工作(广播),在Julia中,您通过使用所谓的" dot明确指定广播行为。打电话",即f.(x, y, z)

答案 1 :(得分:1)

只是为了明确这一点,认为这是一个非常普遍的想法。

即使Int64 <: Integer为真

Array{Int64,1} <: Array{Integer,1}不是!

docs on parametric-composite-types详细解释了原因。但是要解释它基本上是因为前Array{Int64,1}在内存中有一个特定的表示(即许多连续的64位值),而Array{Integer,1}必须是指向单独分配的值的指针集,这些值可能是也可能不是64位。

请参阅类似的Q&amp; A,了解可用于在julia中声明函数的酷新语法0.6 w /关于此:Vector{AbstractString} function parameter won't accept Vector{String} input in julia