Maze Q-Table
5.0
Android OS
O Maze Q-Table
Ta aplikacja w interaktywny sposób wprowadza Cię w naukę przez wzmacnianie.
Uczenie się przez wzmacnianie pozwala agentowi uczyć się metodą prób i błędów w środowisku. Wyobraź sobie labirynt. Korzystając z tabeli Q, agent bada labirynt (stan) i podejmuje różne działania (takie jak poruszanie się w górę, w dół, w lewo lub w prawo). Tabela Q śledzi nagrody (dodatnie za dobre wybory, negatywne za złe decyzje) otrzymane za każde działanie w każdym stanie. Z biegiem czasu agent aktualizuje tabelę Q, aby nadać priorytet działaniom prowadzącym do najwyższej nagrody i ostatecznie uczy się najlepszej ścieżki przez labirynt.
Ucz się poprzez działanie
W tej aplikacji poprowadzisz agenta przez labirynt wypełniony cegłami. Agent użyje techniki zwanej Q-learningiem, aby poruszać się po labiryncie i dotrzeć do celu. Obserwując proces eksploracji i uczenia się agenta, zyskasz zrozumienie koncepcji uczenia się przez wzmacnianie.
* Regulowany poziom trudności
Chcesz ułatwić lub utrudnić pracę agentowi? Możesz kontrolować trudność labiryntu, dostosowując dwa ustawienia:
Rozmiar przeszkody cegieł: wybierz rozmiar cegieł, po których agent będzie musiał się poruszać. Większe cegły tworzą bardziej otwarty labirynt, podczas gdy mniejsze cegły zapewniają mocniejsze ściskanie.
Liczba odcinków: To ustawienie określa, ile razy agent będzie próbował poznać labirynt. Dzięki większej liczbie odcinków agent ma więcej możliwości zbadania i udoskonalenia swojej strategii podejmowania decyzji.
Przejmij kontrolę i śledź postępy
Aplikacja udostępnia dwa przyciski umożliwiające sterowanie symulacją:
Generuj labirynt: Ten przycisk tworzy nowy labirynt z wybranym rozmiarem cegły.
Rozpocznij naukę: Gdy układ labiryntu będzie już zadowalający, kliknij ten przycisk, aby rozpocząć proces uczenia się agenta.
Wizualizuj postępy w nauce
Oprócz obserwowania agenta poruszającego się po labiryncie, możesz także śledzić jego postępy w nauce za pomocą dołączonego wykresu tempa uczenia się. Ten wykres przedstawia nagrody agenta (pozytywne wzmocnienie) w funkcji liczby odcinków. Analizując ten wykres, można zobaczyć, jak tempo uczenia się agenta wpływa na jego podejmowanie decyzji i jak poprawia się ono z biegiem czasu.
Przygotuj się, aby na własnej skórze przekonać się o mocy uczenia się przez wzmacnianie! Gdy agent będzie eksplorował labirynt, zobaczysz, jak uczy się dokonywać optymalnych wyborów i pokonywać wyzwania. Wykres tempa uczenia się jeszcze bardziej poprawi Twoje zrozumienie, wizualizując postęp agenta podczas jego podróży szkoleniowej.
What's new in the latest 1.13
Informacje Maze Q-Table APK
Superszybkie i bezpieczne pobieranie za pośrednictwem aplikacji APKPure
Jedno kliknięcie, aby zainstalować pliki XAPK/APK na Androidzie!