我有一个大项目要处理,数据集已经分类,所以我只想使用我自己的例子,这样每个人都可以理解我的目标。
让我们以Target为例: 我们考虑三个品牌的胶带:Target品牌,3M和Avery。 原始数据框有4列:记录年份,Product_Name(包含三个品牌的磁带),Sales和Region。
原始数据框将如下所示:
Year of Record Product_Name Sales Region
2018 Target_Brand 2000$ Midwest
... ... ... ...
2018 Avery 9000$ Central America
我想基于例如区域,销售等创建可视化
我应该使用barplot吗?
第二个问题
当我运行多个回归模型时,我的R代码说明了这一点:
data = read.excel(...) data1 = subset(data,Product_Name ==" Target Brand")
model = lm(Product_Name~。,data1)
Error in `contrasts<-`(`*tmp*`, value = contr.funs[1 + isOF[nn]]) :
contrasts can be applied only to factors with 2 or more levels
In addition: Warning message:
In storage.mode(v) <- "double" : NAs introduced by coercion
我该如何处理这种情况?
(P.S:我的真实数据集有大约36列,我截断到21列。这就是我使用符号〜的原因。)
我需要帮助。请给我指导。