Maze Q-Table
5.0
Android OS
دربارهی Maze Q-Table
این برنامه شما را با یادگیری تقویتی به صورت تعاملی آشنا می کند.
یادگیری تقویتی به عامل اجازه می دهد تا از طریق آزمون و خطا در یک محیط یاد بگیرد. یک پیچ و خم را تصور کنید. با استفاده از یک جدول Q، عامل پیچ و خم (وضعیت) را بررسی می کند و اقدامات مختلفی را انجام می دهد (مانند حرکت به بالا، پایین، چپ یا راست). جدول Q پاداشهای دریافتی (مثبت برای انتخابهای خوب، منفی برای تصمیمهای بد) را برای هر عمل در هر حالت پیگیری میکند. با گذشت زمان، عامل برای اولویت بندی اقداماتی که منجر به بالاترین پاداش می شود، جدول Q را به روز می کند و در نهایت بهترین مسیر را از طریق پیچ و خم یاد می گیرد.
با انجام دادن یاد بگیرید
در این برنامه، یک عامل را از طریق پیچ و خم پر از آجر راهنمایی می کنید. عامل از تکنیکی به نام یادگیری Q برای حرکت در پیچ و خم و رسیدن به هدف استفاده خواهد کرد. با مشاهده فرآیند کاوش و یادگیری عامل، درک درستی از مفاهیم یادگیری تقویتی به دست خواهید آورد.
* سختی قابل تنظیم
آیا می خواهید کار را برای نماینده آسان تر یا سخت تر کنید؟ با تنظیم دو تنظیم می توانید سختی ماز را کنترل کنید:
اندازه مانع آجری: اندازه آجرهایی را انتخاب کنید که عامل برای حرکت در اطراف آنها نیاز دارد. آجرهای بزرگتر پیچ و خم بازتری ایجاد می کنند، در حالی که آجرهای کوچکتر فشار محکم تری ایجاد می کنند.
تعداد قسمتها: این تنظیم تعیین میکند که مامور چند بار تلاش میکند تا ماز را یاد بگیرد. با اپیزودهای بیشتر، عامل فرصت های بیشتری برای کشف و اصلاح استراتژی تصمیم گیری خود دارد.
کنترل کنید و پیشرفت را دنبال کنید
این برنامه دو دکمه برای کنترل شبیه سازی ارائه می دهد:
Generate Maze: این دکمه پیچ و خم جدیدی با اندازه آجر انتخابی ایجاد می کند.
شروع به یادگیری: هنگامی که از طرح ماز راضی شدید، روی این دکمه کلیک کنید تا فرآیند یادگیری عامل شروع شود.
تجسم پیشرفت یادگیری
علاوه بر مشاهده ماموریت در پیچ و خم، میتوانید پیشرفت یادگیری آن را با نمودار نرخ یادگیری موجود نیز پیگیری کنید. این نمودار پاداش های عامل (تقویت مثبت) را در مقابل تعداد قسمت ها ترسیم می کند. با تجزیه و تحلیل این نمودار، می توانید ببینید که نرخ یادگیری عامل چگونه بر تصمیم گیری آن تأثیر می گذارد و چگونه در طول زمان بهبود می یابد.
آماده باشید تا از نزدیک شاهد قدرت یادگیری تقویتی باشید! همانطور که مامور در پیچ و خم کاوش می کند، خواهید دید که چگونه می آموزد که انتخاب های بهینه انجام دهد و بر چالش غلبه کند. نمودار نرخ یادگیری با تجسم پیشرفت عامل در طول سفر آموزشی، درک شما را بیشتر افزایش می دهد.
جدیدترین 1.13 چه خبر است
دانلود فوق سریع و ایمن از طریق برنامه APKPure
برای نصب فایل های XAPK/APK در اندروید با یک کلیک!