Question

我正在研究word2vec，但是当我使用word2vec来训练文本数据时，会发生Numpy的OverFlowError。

消息是，

$('document').ready(function(){
    $( ".tp-caption.black:contains('.000000')" ).text('.1111111');
});

你能告诉我案件吗？

我的机器是x64，操作系统是Windows 7，但python34是32位。 numpy和scipy也是32位。

Answer 1

我也是这样。看起来gensim在dev分支中有一个潜在的解决方法。

这并没有解决在不同硬件之间导航和安装int大小的核心问题，但我认为它应该可以缓解这一特定行的问题。

必要的变更涉及转出

model.vocab[w].sample_int > model.random.randint(2**32)

的

model.vocab[w].sample_int > model.random.rand() * 2**32

这可以避免在randint中创建的64位/ 32位int问题。

更新：我手动将该更改合并到我的gensim安装中，它可以防止错误。