我有一个数据集,其中包含具有以下布局/架构的项目:
{
words: "Hi! How are you? My name is Helennastica",
ratio: 0.32,
importantNum: 382,
wordArray: ["dog", "cat", "friend"],
isItCorrect: false,
type: 2
}
我有很多不同类型的数据,包括:
任务是创建一个RNN(通常,这样的系统可以在再获得一小部分数据时迅速进行重新训练,而不是全部重新处理-我认为 RNN是最佳选择;请参阅下面的推理),它可以使用所有这些因素将任何数据集归为4类中的一种-在上面的示例中,用type
键标记为数字0-3。
我有一组以上格式的示例(提供了答案),并且我的数据库充满了未分类的示例。我的意图是能够在该集合上运行ML模型,并将所有模型分类。我之所以需要快速进行重新训练,是因为有反馈功能:如果AI出现问题,任何用户都可以报告它,在这种情况下,特定的JSON将被添加到数据集中。显然,必须重新训练1000种以上的JSON才能增加额外的JSON需要花很多时间-如果我没记错的话,RNN可以解决这个问题。
我发现了许多类似的可能用例,但我花了数小时在Github上浏览以尝试找到实现,或者使用一些Tensorflow模块/插件来简化/复制,但无济于事。< / p>
我认为使用Tensorflow并不会太困难,而且我了解其中的一些数学和逻辑(但没有受过正式教育,所以我可能有差距!),但是不幸的是,我基本上没有使用Tensorflow的经验/其他任何ML框架(除了某些其他项目的复制粘贴代码之外)。如果有人可以以Github repo / Python框架的形式向我指出正确的方向,甚至编写一些演示代码来帮助解决此问题,将不胜感激。而且,如果您只是要纠正我的一些技术知识/告诉我我在哪里犯错了,那我将非常感谢您提供的反馈意见(仅将其作为评论)。
谢谢!