如何在上下文强盗模式下用-a(审计)选项解释vw输出?

时间:2015-03-11 09:28:00

标签: vowpalwabbit

我正在为2个不同的集合运行上下文bandint方法,这些集合仅在操作变量中有所不同。我在(klaster3.model)上构建模型的一组有6种不同的动作类型,而我构建模型的另一组(klaster8.model)有7种不同的动作类型。

当我跑这样一条线时 head testLabels -n 1 | vw -i klaster8.model -t -p /dev/stdout --quiet 在命令行中我得到 5.000000 Mloda_kobieta 这看起来像是针对该背景的政策中的选择行动。

但是当我使用-a(审计)选项尝试相同的代码时,我收到了这样的输出:

0.943965 Mloda_kobieta Constant:142055:1:0.50745 ^K:136407:1:0.236886 ^Young:101199:1:0.199628 0.994175 Mloda_kobieta Constant:142056:1:0.488827 ^K:136408:1:0.281023 ^Young:101200:1:0.224326 0.948740 Mloda_kobieta Constant:142057:1:0.482498 ^K:136409:1:0.2568 ^Young:101201:1:0.209442 0.979921 Mloda_kobieta Constant:142058:1:0.497253 ^K:136410:1:0.241421 ^Young:101202:1:0.241247 0.910945 Mloda_kobieta Constant:142059:1:0.506602 ^K:136411:1:0.208468 ^Young:101203:1:0.195875 1.004143 Mloda_kobieta Constant:142060:1:0.49813 ^K:136412:1:0.280554 ^Young:101204:1:0.225459 0.934807 Mloda_kobieta Constant:142061:1:0.494118 ^K:136413:1:0.240735 ^Young:101205:1:0.199954 0.953710 Mloda_kobieta Constant:142048:1:0.582269 ^K:136400:1:0.213502 ^Young:101192:1:0.15794 0.994442 Mloda_kobieta Constant:142049:1:0.526175 ^K:136401:1:0.243671 ^Young:101193:1:0.224595 0.944228 Mloda_kobieta Constant:142050:1:0.504455 ^K:136402:1:0.22308 ^Young:101194:1:0.216693 0.979964 Mloda_kobieta Constant:142051:1:0.521737 ^K:136403:1:0.233687 ^Young:101195:1:0.22454 0.907704 Mloda_kobieta Constant:142052:1:0.547686 ^Young:101196:1:0.186401 ^K:136404:1:0.173617 1.004132 Mloda_kobieta Constant:142053:1:0.549014 ^K:136405:1:0.247787 ^Young:101197:1:0.207331 0.937724 Mloda_kobieta Constant:142054:1:0.525254 ^K:136406:1:0.236784 ^Young:101198:1:0.175686 5.000000 Mloda_kobieta

对于此上下文,这看起来像某种行为评分,在我看来应该选择得分最少的行动(这是本例中的动作5)。我想知道为什么有14行,而我在这个数据集中只有7种不同的acion类型?当我有6种不同的动作类型时,为什么我会收到12行。它看起来像number_of_different_acion_types * 2。在我的情况下,只有2个解释变量,年龄和性别。

问题是:

1)带有audit(-a)的输出中的行数是否与等式相对应:number_of_different_acion_types * number_of_explanatory_variables

2)如果是,前七行(在该示例中)是对应于第一个变量,另一个是7到第二个变量吗?

3)如何知道输出的顺序是什么?哪个变量被视为第一个,哪个变量被视为第二个?它是否对应于输入数据集中列的顺序?

4)如果前7行对应第1个变量的成本系数,而其他7行对应第2个变量的成本系数,那么输出策略是否选择具有最低总和的臂/动作那些系数? (每个动作都有2个系数,因为有2个变量)。

我怀疑输出的顺序与输入中的列顺序相对应,但我不确定。

感谢您的回答。

0 个答案:

没有答案