适当的算法将字符串转换为整数,同时保持语义值

时间:2015-05-13 14:44:28

标签: javascript nlp

我一直试图将自然语言字符串转换为整数,以便在长期的短期神经网络中使用。我尝试使用一个词袋和一个关联数组转换为二进制数据,每个字母对应一个素数。

我查看Google的word2vec只是为了将单词转换为单词向量,但我正在寻找可以在浏览器中实现的内容。这就是我正在寻找一种可以用js写的算法的原因。

我知道有word2vec的node.js实现,但它们只是在命令行中运行word2vec。

这与我前面提到过的问题here不同,因为我正在寻找保留语义含义的东西。我想过使用单词相似技术,但不知道如何在js中实现resnik相似性。

我非常感谢将nl个句子或它们的主题转换为单词向量或一组int的任何帮助或指导。

0 个答案:

没有答案