- invert_hash适用于回归模型,但是当我激活矩阵分解时,输出对于--readable_model和--invert hash都是相同的。我希望查看每个用户或项目的潜在变量,但不能将其与项目/用户的名称相匹配。这个小型可重复的样本不是向我展示我的所有完整数据集,而是说明了这个问题:
#bash
echo "5 |u user1 |i item1
1 |u user1 |i item2
5 |u user2 |i item2
1 |u user2 |i item1" | vw -f test.vwbin --rank 2
echo "5 |u user1 |i item1
1 |u user1 |i item2
5 |u user2 |i item2
1 |u user2 |i item1" | vw -t -i test.vwbin --invert_hash test.vwih
less test.vwih
结果如下:
Version 7.7.0
Min label:0.000000
Max label:5.000000
bits:18
0 pairs:
0 triples:
rank:2
lda:0
0 ngram:
0 skip:
options:
0 0.026660 0.029663 0.066095 0.001638 0.024027
1 0.004046 0.004133 0.001141 0.035247 0.077151
2 0.071812 0.048789 0.009294 0.078689 0.055306
... (and so on until line 262143)
这些行中没有一行包含字符串' user1',' user2',' item1'或' item2'。我错过了什么吗?
还有一个问题,我无法在文档中找到答案 - 为什么每个事件有5个潜在变量,因为rank = 2?