我正在努力接近单词/词汇方法,将我的输入数据表示为我在keras中的神经网络模型的一个热矢量。
我想构建一个简单的3层网络,但我需要帮助理解和开发一种方法来转换我的标签数据,以文本的形式,sentinment有7个标签,在0-1的范围内的步骤0.2。
我曾试图使用scikit的矢量化器,但它们过于严格,即它们要么标记单词或字符,而我需要将句子与包含单词,字符,标点符号和表情符号的词汇进行比较。当我在测试句子上使用tfid时,它只计算单词并忽略其他所有内容。我还需要有关采用这种热门方法的指导以及如何在keras中实施。