我会先说这个问题,说我在机器学习方面不是专家,但我对神经网络有一个公平的理解。
到目前为止,我为解决琐碎问题而创建的网络都使用了大量训练数据的想法,通过网络提供这些数据并使用反向传播来调整各种权重。
但是,我如何处理实时收集数据的问题,并且网络必须在学习过程中使用此数据,以便预测要采取的适当行动。
例如,假设我正在开发格斗游戏,玩家可以对敌人的怪物进行各种攻击。是否有可能开发一个神经网络来处理玩家正在执行的动作并最终使用这些数据来预测玩家的下一步行动?例如。玩家已连续两次执行 A 操作,使用之前收集的有关玩家的数据,网络预测玩家将执行下一步 B 操作。
不幸的是,我对该主题没有足够的知识来得出关于神经网络是否适合这个问题的结论。如果是这种情况,可以采用哪些技术来解决这个问题?
答案 0 :(得分:0)
你的问题非常笼统,我的答案也是如此。神经网络能够处理这些问题。您应该搜索“使用神经网络在线学习”,“RNN”(循环神经网络),“LSTM”(长期短期记忆)等方法/关键词。 RNN和LSTM是通常用于使用神经网络处理时间相关数据的算法。 游戏中的一些着名的(也是最近的)研究是AlphaGo程序,它玩Go游戏,尝试阅读它,你会感受到时间依赖的机器学习方法。
答案 1 :(得分:0)
“ ... ... 可以采用什么技术来解决这个问题?”
“ 马尔可夫链是描述一系列可能事件的随机模型,其中每个事件的概率仅取决于上一个事件中获得的状态。” “
示例:
“ 以前收集的有关玩家的数据”
1 2 3 observed
A A B 25
A A A 12
A B B 10
对于
“ ... ... 网络预测玩家接下来将执行动作B。”
匹配当前观察到的状态1
和2
。根据此结果,最高记录3
的状态observed
代表最常见的继承。随机选择(与observed
值相关的机会)可能有助于避免过高估计(否则会使“ AI”过于可预测/可操纵)。许多variations可能。