DB1 <- data.frame(orderItemID = c(1,2,3,4,5,6,7,8,9,10),
orderDate = c("1.1.12","1.1.12","1.1.12","1.1.12","1.1.12", "1.1.12","1.1.12","1.1.12","2.1.12","2.1.12"),
itemID = c(2,3,2,5,12,4,2,3,1,5),
size = factor(c("l", "s", "xl", "xs","m", "s", "l", "m", "xxs", "xxl")),
color = factor(c("blue", "black", "blue", "orange", "red", "navy", "red", "purple", "white", "black")),
customerID = c(33, 15, 1, 32, 14, 55, 33, 78, 94, 23))
嘿伙计们,我知道我之前问了这个问题(表达不好) - 但我希望我能得到另一个标题和更好描述的答案。在数据集中具有相同大小或相同颜色的项目,具有相同的ItemID。每个注册用户都有自己独特的customerID。我想确定用户何时订购具有相同itemID的产品(多于一个)(以不同的尺寸或颜色=例如,具有customerID = 33的用户以两种不同的颜色订购相同的商品(ItemID = 2))并标记它在一个名为“选择顺序”(例如)的新列中,带有“是”或“否”。但它应该显示我不是“是”,他或她也订购了具有其他ID的项目。我只是想得到一个“是”,当有一个订单(在同一天或过去)有相同的ID多一次 - 无论其他ID(其他产品)。我已经尝试了很多,但没有任何作用。有几千个不同的userID和ItemId - 所以我不能为每个ID进行子集。我尝试使用重复的功能 - 但它没有提供令人满意的解决方案:问题是,如果同一个人订购了多个对象(customerID被公开),另一个人(customerID)订购一个项目使用相同的ID(itemID被公开),它给了我一个“是”:在这种情况下它必须是“否”。 (在示例中,duplicate函数会在orderItemID 4处给我一个“yes”而不是“no”)
感谢您的帮助!