یک اتوماتای یادگیر را میتوان بصورت یک شئ مجرد که دارای تعداد متناهی عمل است، در نظر گرفت. اتوماتای یادگیر با انتخاب یک عمل از مجموعه عمل¬های خود و اِعمال آن بر محیط، عمل میکند. عمل مذکور توسط یک محیط تصادفی ارزیابی میشود و اتوماتا از پاسخ محیط برای انتخاب عمل بعدی خود استفاده میکند. در طی این فرایند اتوماتا یاد میگیرد که عمل بهینه را انتخاب نماید. نحوه استفاده از پاسخ محیط به عمل انتخابی اتوماتا که در جهت انتخاب عمل بعدی اتوماتا استفاده میشود، توسط الگوریتم یادگیری اتوماتا مشخص میگردد. یک اتوماتای یادگیر از دو قسمت اصلی تشکیل شده است:
1- یک اتوماتای تصادفی با تعداد محدودی عمل و یک محیط تصادفی که اتوماتا با آن در ارتباط است.
2- الگوریتم یادگیری که اتوماتا با استفاده از آن عمل بهینه را یاد میگیرد.
فهرست :
تعریف یادگیری
تاریخچه اتوماتای یادگیر
تقسیم بندی اتوماتاها
محیط Enviroment
رابطه بین اتوماتای یادگیر و محیط
مدل های محیط
معیارهای رفتار اتوماتای یادگیر
الگوریتم یادگیری
انواع اتوماتاهای یادگیر
انواع اتوماتاهای یادگیر با ساختار ثابت
اتوماتای یادگیر با ساختار متغیر
ویژگیهای اتوماتاهای یادگیر
محدودیت ها اتوماتاهای یادگیر
اتوماتای یادگیر توزیع شده