我一直试图将自然语言字符串转换为整数,以便在长期的短期神经网络中使用。我尝试使用一个词袋和一个关联数组转换为二进制数据,每个字母对应一个素数。
我查看Google的word2vec只是为了将单词转换为单词向量,但我正在寻找可以在浏览器中实现的内容。这就是我正在寻找一种可以用js写的算法的原因。
我知道有word2vec的node.js实现,但它们只是在命令行中运行word2vec。
这与我前面提到过的问题here不同,因为我正在寻找保留语义含义的东西。我想过使用单词相似技术,但不知道如何在js中实现resnik相似性。
我非常感谢将nl个句子或它们的主题转换为单词向量或一组int的任何帮助或指导。