Question

我有一个数据集，其中包含具有以下布局/架构的项目：

{
    words: "Hi! How are you? My name is Helennastica",
    ratio: 0.32,
    importantNum: 382,
    wordArray: ["dog", "cat", "friend"],
    isItCorrect: false,
    type: 2
}

我有很多不同类型的数据，包括：

数组（仅一种类型，例如字符串数组或数字数组，绝不能同时使用）
布尔值
具有固定的最小/最大值（即0到1的小数位数）的数字
无限整数（从-∞到∞的任何整数）
带有一些字典，一些新单词的字符串

任务是创建一个RNN（通常，这样的系统可以在再获得一小部分数据时迅速进行重新训练，而不是全部重新处理-我认为 RNN是最佳选择；请参阅下面的推理），它可以使用所有这些因素将任何数据集归为4类中的一种-在上面的示例中，用type键标记为数字0-3。

我有一组以上格式的示例（提供了答案），并且我的数据库充满了未分类的示例。我的意图是能够在该集合上运行ML模型，并将所有模型分类。我之所以需要快速进行重新训练，是因为有反馈功能：如果AI出现问题，任何用户都可以报告它，在这种情况下，特定的JSON将被添加到数据集中。显然，必须重新训练1000种以上的JSON才能增加额外的JSON需要花很多时间-如果我没记错的话，RNN可以解决这个问题。

我发现了许多类似的可能用例，但我花了数小时在Github上浏览以尝试找到实现，或者使用一些Tensorflow模块/插件来简化/复制，但无济于事。< / p>

我认为使用Tensorflow并不会太困难，而且我了解其中的一些数学和逻辑（但没有受过正式教育，所以我可能有差距！），但是不幸的是，我基本上没有使用Tensorflow的经验/其他任何ML框架（除了某些其他项目的复制粘贴代码之外）。如果有人可以以Github repo / Python框架的形式向我指出正确的方向，甚至编写一些演示代码来帮助解决此问题，将不胜感激。而且，如果您只是要纠正我的一些技术知识/告诉我我在哪里犯错了，那我将非常感谢您提供的反馈意见（仅将其作为评论）。

谢谢！

Python中多变量，多类型RNN的实现

0 个答案: