我正在尝试实施 Q Learning ,但情节并未出现在任何地方。我正在 PyCharm Windows 中使用 Python 2.7.5 进行尝试。
from scipy import *
import pylab
from pybrain.rl.environments.mazes import Maze, MDPMazeTask
from pybrain.rl.learners.valuebased import ActionValueTable
from pybrain.rl.agents import LearningAgent
from pybrain.rl.learners import Q
from pybrain.rl.experiments import Experiment
structure = array([[1, 1, 1, 1, 1, 1, 1, 1, 1],
[1, 0, 0, 1, 0, 0, 0, 0, 1],
[1, 0, 0, 1, 0, 0, 1, 0, 1],
[1, 0, 0, 1, 0, 0, 1, 0, 1],
[1, 0, 0, 1, 0, 1, 1, 0, 1],
[1, 0, 0, 0, 0, 0, 1, 0, 1],
[1, 1, 1, 1, 1, 1, 1, 0, 1],
[1, 0, 0, 0, 0, 0, 0, 0, 1],
[1, 1, 1, 1, 1, 1, 1, 1, 1]])
environment = Maze(structure, (7, 7))
controller = ActionValueTable(81, 4)
controller.initialize(1.)
learner = Q()
agent = LearningAgent(controller, learner)
task = MDPMazeTask(environment)
experiment = Experiment(task, agent)
while True:
experiment.doInteractions(100)
agent.learn()
agent.reset()
pylab.pcolor(controller.params.reshape(81,4).max(1).reshape(9,9))
pylab.draw()
预期输出:该图应该到来。
我的Windows机器中安装了以下内容。
PyBrain==0.3
PythonMagick==0.9.9
ipython==1.2.1
libsvm==3.17
matplotlib==1.3.1
numpy==1.8.0
pyparsing==2.0.1
pyreadline==2.0
python-dateutil==2.2
pytz==2013.9
scikit-learn==0.14.1
scipy==0.13.3
six==1.5.2
当前输出:无显示。流程刚刚成功结束。
如何让它发挥作用。帮助它们。
答案 0 :(得分:2)
你需要启动gui威胁。 您可以通过转到交互模式或使用
来执行此操作pylab.show ()