我是R的新手。
我正在尝试定义一个类似于树节点的类,也就是说,它有一个左节点和右节点,它应该与父节点属于同一个类。所以我按如下方式定义了类:
setClass('Node', representation=(left='Node',right='Node', ...))
我想通过设置原型将Node的默认值设置为NULL,但R表示如下:
invalid class "Node" object: invalid object for slot "left" in class "bicluster": got class "NULL", should be or extend class "Node"
但是如果我没有将默认值设置为NULL,那么默认值将是深度为4的递归节点,我认为这会浪费资源。
我的考虑是不必要的还是有更好的方法呢?
答案 0 :(得分:9)
有一段时间,您需要使用setClassUnion("listOrNULL",members=c("list", "NULL"))
将NULL添加到定义为列表的插槽中。我认为现在是一个可用的课程。在您的设置不完整时无法测试,但定义超类“NodeOrNull”可能会让您超越初始障碍。
答案 1 :(得分:7)
这是修改后的答案。
类联合很时髦 - 它们有效地将一个类插入到现有层次结构的中间,因此突然扩展list
的内容现在扩展为listOrNULL
。
相反,我会创建一个小的类层次结构,表示“树”,可以是“空”或“内部”。 “内部”类将有一个包含数据(类型为“ANY”)的插槽,以及左侧和右侧链接,它们将是“树”元素。
setClass("Tree")
setClass("Empty", contains="Tree")
setClass("Internal", contains="Tree",
representation=representation(elem="ANY", left="Tree", right="Tree"),
prototype=prototype(left=new("Empty"), right=new("Empty")))
我将为我的Tree编写一个构造函数,包括创建空树的方法,以及元素加上左右后代的树。
setGeneric("Tree", function(elem, left, right) standardGeneric("Tree"),
signature="elem")
setMethod(Tree, "missing", function(elem, left, right) new("Empty"))
setMethod(Tree, "ANY", function(elem, left, right) {
new("Internal", elem=elem, left=left, right=right)
})
基本操作是将元素x
插入树t
setGeneric("insert", function(x, t) standardGeneric("insert"))
setMethod(insert, c("ANY", "Empty"), function(x, t) {
Tree(x, Tree(), Tree())
})
setMethod(insert, c("ANY", "Internal"), function(x, t) {
if (x < t@elem) {
l <- insert(x, t@left)
r <- t@right
} else {
l <- t@left
r <- insert(x, t@right)
}
Tree(t@elem, l, r)
})
另一项操作是测试会员资格
setGeneric("member", function(x, t) standardGeneric("member"))
setMethod(member, c("ANY", "Empty"), function(x, t) FALSE)
setMethod(member, c("ANY", "Internal"), function(x, t) {
if (x < t@elem) member(x, t@left)
else if (t@elem < x) member(x, t@right)
else TRUE
})
此实现的一个有趣的,功能性的属性是它是持久的
> t <- Tree()
> t1 <- insert(10, t)
> t2 <- insert(5, t1)
> t3 <- insert(7, t2)
> t4 <- insert(15, t3)
> which(sapply(1:20, member, t4))
[1] 5 7 10 15
> which(sapply(1:20, member, t2))
[1] 5 10
当存在大量更新时,这不会有效,因为S4类创建效率低,并且因为修改树(例如,添加节点)会将路径中的所有节点复制到新节点。 different approach将树表示为左,右,值三元组的matrix
。 S4实现仍然会有糟糕的性能,因为实例的更新会创建新实例,重复所有内容。所以我最终会进入一个引用类,其中包含字段'value'(树的任意向量和左右关系matrix
的向量。