我正在为客户和潜在客户制作一组谷歌网络数据,我想创建一个列来对客户和潜在客户进行分类。我可以通过“获取日期”列来识别它们。如果该行具有该日期,则表示该ID是客户,否则为潜在客户。因此,我尝试在包plyr中使用ddply函数使用以下代码:(“acquidate”是包含获取日期的列,我想在创建的新列中为客户显示1,为潜在客户显示0)
data2<-ddply(data2,.(gsid),transform,custindex2=ifelse(is.na(data2$acquidate),0,1))
但是R显示错误消息,如:错误:参数意味着行数不同:2,1557057
然而,当我尝试以下代码时,它就成功了:
data2$custindex<-ifelse(is.na(data2$acquidate),0,1)
我只是不明白为什么ddply不能很好地运行这个项目。如果有人能提供解决方案,我将非常感激!