██ متن فصل بیست و یکم نسخه‌ی رایگان ایبوک هوش مصنوعی ██

 

مترجم: سهراب جلوه گر جلوه‌گر

 

فصل یادگیری با استفاده از مشاهده‌ها؛ و درخت‌های تصمیم‌گیری 

 

فهرست برخی از عنوان‌های نوشته‌ها

یادگیری

انواع بازخورد

یادگیری نظارت شده(کنترل شده)

یادگیری بدون نظارت(کنترل نشده)

تقویّت یادگیری(یادگیری تقویّتی)

تعریف یک مسأله‌ی یادگیری‌

درخت‌های تصمیم‌گیری

 

در گذشته‌ فرض کردیم که دانش اوّلیّه‌ به وسیله‌ی خبره‌ها به ما داده شده است و بر چگونگی استفاده از این دانش‌ تمرکز کردیم‌. حال‌ می‌خواهیم در این مورد صحبت کنیم که، چگونه دانش را از راه مشاهده به دست آوریم و بر قانون‌های گزاره‌ای‌ تمرکز می‌کنیم‌؛ مثلاً‌ اگر هوا(وضعیّت جوّی) آفتابی و گرم باشد‌، آنگاه‌ تنیس‌ بازی کنید و [به صورت گزاره‌ای] می‌نویسیم‌:

sunny  warm  PlayTennis

یا اگر هوا(وضعیّت جوّی) خنک باشد و بارانی باشد یا باد شدید بوزد‌، آنگاه تنیس‌ بازی نکنید و می‌نویسیم‌:

cool  (rain  strongWind)  PlayTennis

یادگیری

 

برای یک عامل‌، یادگیری‌ به چه معنی می‌باشد‌؟:

 تعریف- به این معنی است که، عامل‌، دانش جدید را دریافت می‌نماید‌، دانش جدید را به کار می‌گیرد‌، رفتارش را تغییر می‌دهد و در یک کار معیّن‌، معیارکارآیی خود را بهبود می‌بخشد‌.

عامل‌های یادگیرنده

به یاد بیاورید که در گذشته در مورد عامل‌های یادگیرنده صحبت کردیم‌:

 

یک عامل یادگیرنده‌ دارای یک عنصر کارآیی و یک عنصر یادگیری‌ می‌باشد‌. عنصر کارآیی‌، چیزی است که یک عامل‌ برای تصمیم‌گیری در مورد اینکه چه کاری انجام دهد‌، از آن استفاده می‌کند و این‌ چیزی است که تا‌کنون مطالعه کرده‌ایم‌. عنصر یادگیری‌‌، چیزی است که به عامل‌ برای بازنگری عنصر کارآیی‌ اجازه می‌دهد‌، این ممکن است به معنی اضافه نمودن یا تغییر قانون‌ها یا واقعیّت‌ها‌، بازنگری یک مکاشفه(ابتکار) و تغییر یک تابع جانشین  باشد‌. یک عامل‌ برای بازنگری کردن رفتارش‌ به اطّلاعاتی که به عامل بگوید چگونه به‌خوبی‌ کارش را انجام می‌دهد‌، نیازمند می‌باشد‌، این اطّلاعات،‌ بازخورد ‌ نام دارد‌.

  انواع بازخورد

در اصل‌ سه نوع عملکرد یادگیری‌ وجود دارد که هر کدام‌ بازخورد متفاوتی دارد‌:

یادگیری نظارت شده (کنترل شده)

 تعریف- یکی از عمومی‌ترین شکل‌های یادگیری‌ می‌باشد‌؛ در این مورد‌ یک منبع خارجی (که اغلب‌ یاد(آموزش) دهنده ‌ نام دارد)‌، عامل را با نمونه‌های برچسب زده شده ‌ ارائه می‌نماید، که باید از این داده‌ها برای تشخیص قانون‌های کلّی‌تر‌ استفاده نماید‌؛

مثلاً نمونه‌ها‌ می‌توانند این موردها باشند: لیست بیماران و ویژگی‌ها‌؛ چه عامل‌هایی مرتبط با سرطان می‌باشند‌؟؛ چه عواملی‌ فردی را دارای خطر می‌داند‌؟؛ بهترین سؤالات‌ برای طبقه‌بندی حیوان‌ها چیست‌؟؛ صورت چه فردی یا چه جانوری در این تصویر می‌باشد؟؛ این پردازش یادگیری(به دست آوردن) قانون‌های کلّی، از واقعیّت‌های مشخّص‌، استنتاج  نام دارد‌.‌ عامل‌، موردهای(عملکردهای) معیّنی را در طول طبقه‌بندی‌اشان می‌بیند‌.

 

در شکل بالا وقتی که عامل، عنکبوت را به اشتباه مارمولک می‌پندارد، آموزش دهنده این مطلب را به او می‌گوید.

یادگیری بدون نظارت (کنترل نشده)

 تعریف- در این مورد‌ آموزش دهنده‌ای برای ارائه‌ی نمونه‌ها وجود ندارد و عامل‌ معمولاً‌ برای پیداکردن الگوهایی در داده‌ها تلاش می‌نماید‌.

 

تقویّت یادگیری(یادگیری تقویّتی)

 تعریف- یک نوع مخصوص از یادگیری‌ است که در آن‌ عامل‌ فقط‌ درست بودن یا غلط بودن را برای انجام یک عمل‌ دریافت می‌نماید‌ و ممکن است «بهترین» عملکرد را برای انجام نداند‌.

 

در شکل بالا وقتی که عامل به اشتباه عنکبوت را مارمولک می‌پِندارد، کارشناس(خبره)، غلط بودن این پندار را به او می‌گوید و عامل دوباره خود را به‌روز کرده و تلاش می‌کند.

 

  تعریف یک مسأله‌ی یادگیری‌

می‌توانیم مسأله‌ی یادگیری را با تخمین‌، به صورت یک تابع f‌، که به ما می‌گوید چگونه یک مجموعه از ورودی‌ها را طبقه‌بندی نماییم‌، تفسیر کنیم‌؛ یک مثال‌ در این مورد‌ یک مجموعه از ورودی‌های x و f(x) متناظر می‌باشد‌:

<<Mammal ,Eats-Meat ,Black-Stripes ,Tawny >,Tiger >

 

شکل بالا- بَبر

 

‌درخت‌های تصمیم‌گیری

 تعریف نخست: درخت تصمیم‌گیری، روشی(نموداری درختی) برای بیان تصمیم‌گیری‌های ترتیبی و نتیجه‌های ممکن از این تصمیم‌گیری‌ها است.

 تعریف دوّم: درخت تصمیم‌گیری، نموداری درختی است که برای تصمیم‌گیری در تجارت یا برنامه‌نویسی کامپیوتر مورد استفاده قرار می‌گیرد و در آن، گرهها(گزینه‌ها) با در نظر گرفتن ریسک‌ها، هزینه‌ها، نتیجه‌ها یا احتمال‌ها بیان می‌شوند. 

در هر گره، در درخت‌، یک ویژگی‌ آزمایش(تست) می‌شود‌. در زیر، یک درخت تصمیم‌گیری را می‌بینید:

 

چکیده‌ی مطلب‌های فصل بیست و یکم

 برای یک عامل‌، یادگیری‌ به این معنی است که، عامل،‌ دانش جدید را دریافت می‌نماید‌، دانش جدید را به کار می‌گیرد‌، رفتارش را تغییر می‌دهد و در یک کار معیّن‌، معیارکارآیی خود را بهبود می‌بخشد‌.

یک عامل‌ برای بازنگری کردن رفتارش‌ به اطّلاعاتی که به عامل بگوید چگونه به‌خوبی‌ کارش را انجام می‌دهد‌، نیازمند می‌باشد‌، این اطّلاعات‌، بازخورد‌ نام دارد‌.

سه نوع عملکرد یادگیری‌ وجود دارد که هر کدام‌ بازخورد متفاوتی دارد‌: یادگیری نظارت شده، یادگیری بدون نظارت، و تقویّت یادگیری.

درخت‌ تصمیم‌گیری، نموداری درختی برای بیان تصمیم‌گیری‌های ترتیبی و نتیجه‌های ممکن از این تصمیم‌گیری‌ها است.