ARHES包错误lhs%ain%newBasket:table包含未知项标签

时间:2016-12-09 15:05:33

标签: r data-science arules rdata market-basket-analysis

摘要
我正在使用Arule包创建带有RStudio的篮子分析规则。 我将WorkSpace保存到文件(即 x.RDATA )。并使用VS.NET中的R.DOTNET Nuget PackAge查询规则。我正在呼叫射频发送参数。

到目前为止没有问题。 但.... 当我发送ARule函数中不存在的ProductCode时,它会抛出错误。

  

lhs%ain%newBasket:table包含未知项标签

时出错

我使用数据集 Groceries 来重现场景。 在我看来,产品不能在模型中。

它可以是新产品 OR 它在规则中不存在,因为它的信心,SUPORT或LIFT

# Load the libraries
library(arules)
library(arulesViz)
library(datasets)

# Load the data set
data(Groceries)
# Get the rules
rules <- apriori(Groceries, parameter = list(supp = 0.001, conf = 0.8))
# Sorting 
rules<-sort(rules, by="confidence", decreasing=TRUE)

# Redundancies 
subset.matrix <- is.subset(rules, rules)
subset.matrix[lower.tri(subset.matrix, diag=T)] <- NA
redundant <- colSums(subset.matrix, na.rm=T) >= 1
rules.pruned <- rules[!redundant]
rules<-rules.pruned

#-----------------------------------------------------------------------------------
#FUNCTION
fn_findRules <- function(rules, newBasket){
  arules<-subset(rules, subset = lhs %ain% newBasket)
  arules.sorted <- sort(arules, by="lift")
  return (arules)
}
#-----------------------------------------------------------------------------------

当我使用参数&#34;热带水果&#34;,&#34;酸奶&#34;没问题。

#Calling Function For Test 
newBasketItems <- c("tropical fruit", "yogurt")
RuleResult <- fn_findRules(rules, newBasketItems)
inspect(RuleResult[1:5])

结果:

    lhs                                                                rhs                support   confidence lift  
264 {tropical fruit,grapes,whole milk,yogurt}                       => {other vegetables} 0.0010168 1.00000    5.1682
269 {ham,tropical fruit,pip fruit,yogurt}                           => {other vegetables} 0.0010168 1.00000    5.1682
276 {tropical fruit,root vegetables,yogurt,oil}                     => {whole milk}       0.0011185 1.00000    3.9136
395 {sausage,tropical fruit,root vegetables,yogurt}                 => {whole milk}       0.0015252 0.93750    3.6690
410 {citrus fruit,tropical fruit,root vegetables,whole milk,yogurt} => {other vegetables} 0.0014235 0.93333    4.8236

但是,如果我使用参数调用该函数&#34; 热带新产品&#34;,&#34;酸奶&#34;它会引发错误。

#Calling Function
newBasketItems <- c("tropical NEW PRODUCT", "yoguurt")
RuleResult <- fn_findRules(rules, newBasketItems)

Error in lhs %ain% newBasket : table contains an unknown item label 

如何处理此错误?

1 个答案:

答案 0 :(得分:-1)

您正在将其与Groceries数据集中不存在的内容进行比较,这就是导致此错误的原因。尝试使用表中包含的“小果”,“苏打”等东西。