Python中多变量,多类型RNN的实现

时间:2019-05-13 20:23:23

标签: python tensorflow recurrent-neural-network categorization

我有一个数据集,其中包含具有以下布局/架构的项目:

{
    words: "Hi! How are you? My name is Helennastica",
    ratio: 0.32,
    importantNum: 382,
    wordArray: ["dog", "cat", "friend"],
    isItCorrect: false,
    type: 2
}

我有很多不同类型的数据,包括:

  • 数组(仅一种类型,例如字符串数组或数字数组,绝不能同时使用)
  • 布尔值
  • 具有固定的最小/最大值(即0到1的小数位数)的数字
  • 无限整数(从-∞到∞的任何整数)
  • 带有一些字典,一些新单词的字符串

任务是创建一个RNN(通常,这样的系统可以在再获得一小部分数据时迅速进行重新训练,而不是全部重新处理-我认为 RNN是最佳选择;请参阅下面的推理),它可以使用所有这些因素将任何数据集归为4类中的一种-在上面的示例中,用type键标记为数字0-3。

我有一组以上格式的示例(提供了答案),并且我的数据库充满了未分类的示例。我的意图是能够在该集合上运行ML模型,并将所有模型分类。我之所以需要快速进行重新训练,是因为有反馈功能:如果AI出现问题,任何用户都可以报告它,在这种情况下,特定的JSON将被添加到数据集中。显然,必须重新训练1000种以上的JSON才能增加额外的JSON需要花很多时间-如果我没记错的话,RNN可以解决这个问题。

我发现了许多类似的可能用例,但我花了数小时在Github上浏览以尝试找到实现,或者使用一些Tensorflow模块/插件来简化/复制,但无济于事。< / p>

我认为使用Tensorflow并不会太困难,而且我了解其中的一些数学和逻辑(但没有受过正式教育,所以我可能有差距!),但是不幸的是,我基本上没有使用Tensorflow的经验/其他任何ML框架(除了某些其他项目的复制粘贴代码之外)。如果有人可以以Github repo / Python框架的形式向我指出正确的方向,甚至编写一些演示代码来帮助解决此问题,将不胜感激。而且,如果您只是要纠正我的一些技术知识/告诉我我在哪里犯错了,那我将非常感谢您提供的反馈意见(仅将其作为评论)。

谢谢!

0 个答案:

没有答案