我正在研究mahout推荐引擎用例。我预先计算了推荐并存储在数据库中。现在我打算向品味休息服务公开.net.i有限的客户和产品。这是经销商级推荐用例。我的问题是,如果新的经销商进来,我将如何向他推荐建议。还将如何我建议每个经销商的推荐产品数量。你能不能给我一些指导。我将面临性能问题..?
答案 0 :(得分:0)
一种方法是,当新用户到来时,为所有用户或仅针对此用户预先计算推荐。您应该知道此用户可能也会更改其他人的建议。根据您的需要,您经常需要进行预先计算。
但是,如果您的用户和项目数量有限,另一种方法是使用在线推荐器实时计算推荐值。如果您使用FileDataModel
,则可以定期从新用户获取数据(请参阅书籍Mahout in Action)。如果您使用更快的内存数据模型,则可以覆盖方法:setPreference(long userID, long itemID, float value)
和removePreference(long userID, long itemID)
,每当新用户来到并喜欢或删除某些项目时,您应该在数据模型上调用这些方法。
编辑:基本上您可以获得GenericDataModel
,并将其添加到方法setPreference
和removePreference
。这将是您的低级数据模型。您可以通过ReloadFromJDBCDataModel
方法设置数据模型,然后使用reload()
将其包装起来:
DataModel newDelegateInMemory = delegate.hasPreferenceValues() ? new MutableDataModel(delegate.exportWithPrefs()) :new MutableBooleanPrefDataModel(delegate.exportWithIDsOnly());
重写的方法:
@Override
public void setPreference(long userID, long itemID, float value) {
userIDs.add(userID);
itemIDs.add(itemID);
setMinPreference(Math.min(getMinPreference(), value));
setMaxPreference(Math.max(getMaxPreference(), value));
Preference p = new GenericPreference(userID, itemID, value);
// User preferences
GenericUserPreferenceArray newUPref;
int existingPosition = -1;
if (preferenceFromUsers.containsKey(userID)) {
PreferenceArray oldPref = preferenceFromUsers.get(userID);
newUPref = new GenericUserPreferenceArray(oldPref.length() + 1);
for (int i = 0; i < oldPref.length(); i++) {
//If the item does not exist in the liked user items, add it!
if(oldPref.get(i).getItemID()!=itemID){
newUPref.set(i, oldPref.get(i));
}else{
//Otherwise remember the position
existingPosition = i;
}
}
if(existingPosition>-1){
//And change the preference value
oldPref.set(existingPosition, p);
}else{
newUPref.set(oldPref.length(), p);
}
} else {
newUPref = new GenericUserPreferenceArray(1);
newUPref.set(0, p);
}
if(existingPosition == -1){
preferenceFromUsers.put(userID, newUPref);
}
// Item preferences
GenericItemPreferenceArray newIPref;
existingPosition = -1;
if (preferenceForItems.containsKey(itemID)) {
PreferenceArray oldPref = preferenceForItems.get(itemID);
newIPref = new GenericItemPreferenceArray(oldPref.length() + 1);
for (int i = 0; i < oldPref.length(); i++) {
if(oldPref.get(i).getUserID()!=userID){
newIPref.set(i, oldPref.get(i));
}else{
existingPosition = i;
}
}
if(existingPosition>-1){
oldPref.set(existingPosition, p);
}else{
newIPref.set(oldPref.length(), p);
}
} else {
newIPref = new GenericItemPreferenceArray(1);
newIPref.set(0, p);
}
if(existingPosition == -1){
preferenceForItems.put(itemID, newIPref);
}
}
@Override
public void removePreference(long userID, long itemID) {
// User preferences
if (preferenceFromUsers.containsKey(userID)) {
List<Preference> newPu = new ArrayList<Preference>();
for (Preference p : preferenceFromUsers.get(userID)) {
if(p.getItemID()!=itemID){
newPu.add(p);
}
}
preferenceFromUsers.remove(userID);
preferenceFromUsers.put(userID, new GenericUserPreferenceArray(newPu));
}
if(preferenceFromUsers.get(userID).length()==0){
preferenceFromUsers.remove(userID);
userIDs.remove(userID);
}
if (preferenceForItems.containsKey(itemID)) {
List<Preference> newPi = new ArrayList<Preference>();
for (Preference p : preferenceForItems.get(itemID)) {
if(p.getUserID() != userID){
newPi.add(p);
}
}
preferenceForItems.remove(itemID);
preferenceForItems.put(itemID, new GenericItemPreferenceArray(newPi));
}
if(preferenceForItems.get(itemID).length()==0){
//Not sure if this is needed, but it works without removing the item
//preferenceForItems.remove(itemID);
//itemIDs.remove(itemID);
}
}
答案 1 :(得分:0)
如果是&#34;新经销商&#34;你的意思是你没有他们的数据,没有历史数据。然后,您无法使用Mahout的推荐人提出建议。
一旦他们选择了其他物品,您可以建议其他物品。使用Mahout&#34; itemsimilarity&#34;驱动程序计算目录中所有内容的类似项目。然后,如果他们选择了某些东西,你可以建议类似的东西。
来自项目相似度驱动程序的项目可以作为包含每个项目的类似项目的ID的列值存储在您的数据库中。然后,您可以使用搜索引擎索引列,并使用用户的第一个订单作为查询。这将返回实时个性化推荐,是Mahout人员建议的最新方法。
有关Mahout数据科学家之一的Ted Dunning,请参阅本书中有关如何执行此操作的说明。 http://www.mapr.com/practical-machine-learning