使用word2vec表示哈希值是否有意义?

时间:2017-04-27 09:12:15

标签: neural-network word2vec

我有一个包含非确定长度的数据包序列的执行路径。例如,/ A / B / C / D / E,/ A / E / G / B等,其中大写字符是由散列值表示的分组。如果我使用word2vec表示每个数据包是否有意义?

1 个答案:

答案 0 :(得分:1)

Word2Vec依赖于预测性共现来实现其有用的密集嵌入式表示。

如果您使用强哈希将数据包中的单个位差异转换为完全不同的令牌,那么这可能是无用的'噪音'到Word2Vec。

如果它是一个有点语义的哈希,用于提供类似令牌的类似数据包,它对Word2Vec算法可能是合适的和有帮助的。

当你提到你的最终目标是"预测这条路径是否导致错误的系统全局状态时,我想知道Word2Vec字矢量是否是一个合适的工具。 Word2Vec在其模型中没有太多深度/重现/序列有状态;它不太可能捕获关于基础"状态机的很多知识"或者"非法状态",虽然它可能有助于定位一个'数据包'与基于相似的前任/后继数据包的其他数据库类似(作为其他更有状态分析的有用信息)。