Maze Q-Table
JerryDice
2024年07月11日
5.0
Android OS
关于Maze Q-Table
该应用程序以交互方式向您介绍强化学习。
强化学习允许代理通过环境中的反复试验来学习。想象一个迷宫。使用 Q 表,代理探索迷宫(状态)并采取不同的操作(例如向上、向下、向左或向右移动)。 Q 表记录每个状态下每个动作所获得的奖励(好的选择为正,坏的决策为负)。随着时间的推移,代理会更新 Q 表,以优先考虑带来最高奖励的行动,并最终学习穿过迷宫的最佳路径。
通过实践学习
在此应用程序中,您将引导特工穿过充满砖块的迷宫。代理将使用一种称为 Q 学习的技术来导航迷宫并达到目标。通过观察代理的探索和学习过程,您将了解强化学习概念。
*可调节难度
想让代理的事情变得更容易还是更困难?您可以通过调整两个设置来控制迷宫的难度:
砖块障碍尺寸:选择代理需要绕过的砖块尺寸。较大的砖块可以创造出更开放的迷宫,而较小的砖块则可以创造出更紧凑的迷宫。
Number of Episodes:此设置确定代理将尝试学习迷宫的次数。随着情节的增加,智能体有更多的机会探索和完善其决策策略。
掌控并跟踪进度
该应用程序提供了两个按钮来控制模拟:
生成迷宫:此按钮使用所选砖块尺寸创建一个新迷宫。
开始学习:一旦您对迷宫布局感到满意,请单击此按钮开始代理的学习过程。
可视化学习进度
除了观察代理在迷宫中导航之外,您还可以使用随附的学习率图来跟踪其学习进度。该图绘制了代理的奖励(正强化)与情节数的关系。通过分析此图,您可以看到代理的学习率如何影响其决策以及它如何随着时间的推移而改进。
准备好亲眼目睹强化学习的力量吧!当智能体探索迷宫时,您将看到它如何学习做出最佳选择并克服挑战。学习率图表将通过可视化代理在整个训练过程中的进度来进一步增强您的理解。
最新版本1.13的更新日志
Last updated on 2024年07月11日
Minor bug fixes and improvements. Install or update to the newest version to check it out!
在APKPure上极速安全下载应用
一键安装安卓XAPK/APK文件!