یادگیری ماشین یا ماشین لرنینگ، زیرشاخه‌ای از هوش مصنوعی و متمرکز بر توسعه مدل‌ها و الگوریتم‌هایی است که به کامپیوتر امکان می‌دهند از داده‌ها یاد گرفته و بدون آن‌که از طریق برنامه‌نویسی به آن فرمان داده شود و تنها از طریق تجربیات پیشین، عملکرد خود را در کاربردهای مختلف بهبود بخشد. به بیان ساده‌تر، یادگیری ماشین با فرا گرفتن الگوهای موجود در داده‌ها، به سیستم‌ها یاد می‌دهد چگونه مانند انسان فکر کنند. در این مطلب از مجله فرادرس، با انواع یادگیری ماشین آشنا شده و به اهمیت آن در ادامه مسیر فعالیت در این حوزه پی می‌بریم. در حقیقت یادگیری ماشین نوعی سیستم آموزشی است که از تجربیات گذشته درس گرفته و با گذشت زمان پیشرفت می‌کند. با استفاده از انواع روش های یادگیری ماشین، می‌توانیم اطلاعات و رویدادهای بسیاری را پیش‌بینی کرده و به نتایج ارزشمندی دست پیدا کنیم.

فهرست مطالب این نوشته

در این مطلب از مجله فرادرس، پس از ارائه شرح کلی از انواع یادگیری ماشین، چهار گروه اصلی روش‌های یادگیری ماشین را با طرح مثالی کاربردی بررسی می‌کنیم. سپس با رایج‌ترین روش‌های این چهار گروه از انواع یادگیری ماشین آشنا شده و مزایا، معایب و کاربردهای هر کدام را تشریح می‌کنیم. در انتهای این مطلب نیز به چند نمونه از سوالات متداول این حوزه پاسخ می‌دهیم.

انواع یادگیری ماشین چیست؟

هر یک از روش‌های انواع یادگیری ماشین، ویژگی‌ها و کاربردهای خاصی دارد. به عنوان برخی از انواع روش‌های یادگیری ماشین می‌توان به موارد زیر اشاره کرد:

  1. «یادگیری ماشین نظارت شده» (Supervised Machine Learning)
  2. «یادگیری ماشین نظارت نشده» (Unsupervised Machine Learning)
  3. «یادگیری ماشین نیمه نظارت شده» (Semi-Supervised Machine Learning)
  4. «یادگیری تقویتی» (Reinforcement Learning)
نمودار نشان دهنده انواع یادگیری ماشین که با رنگ سبز نشان داده شده است.
انواع یادگیری ماشین

در ادامه، به شرح انواع یادگیری ماشین فهرست شده در لیست بالا پرداخته و توضیح جامعی از هر کدام ارائه می‌دهیم.

یادگیری ماشین نظارت شده چیست؟

به فرایندی که در آن مدل با «مجموعه‌داده‌ای برچسب‌گذاری شده» (Labelled Dataset) آموزش ببیند، «یادگیری نظارت شده» (Supervised Learning) گفته می‌شود. مجموعه‌داده‌های برچسب‌گذاری شده، هم پارامترهای ورودی و هم خروجی را شامل می‌شوند و الگوریتم‌های یادگیری نظارت شده، نقاط داده ورودی را با خروجی‌های مرتبط تطبیق می‌دهند. در یادگیری نظارت شده هر دو مجموعه‌داده «آموزشی» (Training) و «اعتبارسنجی» (Validation) برچسب‌گذاری شده هستند.

مثال یادگیری ماشین نظارت شده

فرض کنید قرار است «دسته‌بند تصویری» (Image Classifier) بسازید که بتواند میان تصاویر سگ‌ها و گربه‌ها تمایز قائل شود. اگر از مجموعه‌داده‌ای برچسب‌گذاری شده برای آموزش الگوریتم یادگیری ماشین خود استفاده کنید، مدل یاد می‌گیرد تصاویر مختلف سگ‌ها و گربه‌ها را در گروه‌هایی متفاوت دسته‌بندی کند. پس از فرایند آموزش و هنگام آزمایش سیستم، زمانی که تصویری جدیدی از سگ یا گربه به آن داده شود، مدل یادگیری ماشین از آموخته‌های خود برای پیش‌بینی پاسخ بهره می‌برد. مثالی از یادگیری نظارت شده که نحوه کارکرد یک مدل «دسته‌بندی تصویر» (Image Classification) را نشان می‌دهد. یادگیری نظارت شده به دو روش زیر تقسیم می‌شود:

  • «دسته‌بندی» (Classification)
  • «رگرسیون» (Regression)

یادگیری نظارت شده

مثال یادگیری نظارت شده

در ادامه، دو روش دسته‌بندی و رگرسیون را توضیح می‌دهیم.

دسته‌بندی

متغیرهای هدف یا همان برچسب‌های نهایی در مسائل دسته‌بندی، ماهیتی «دسته‌ای» (Categorical) داشته و در غالب کلاس‌هایی قابل شمارش و گسسته به مدل یادگیری ماشین ارائه می‌شوند. دسته‌بندی ایمیل‌های عادی از اسپم، پیش‌بینی هوا و پیش‌بینی خطر بیماری قلبی یک بیمار، از جمله مثال‌های مسائل «دسته‌بندی» (Classification) هستند. الگوریتم‌های دسته‌بندی یاد می‌گیرند چگونه میان ویژگی‌های ورودی و کلاس‌های از پیش تعریف شده ارتباط برقرار کنند. از جمله الگوریتم‌های دسته‌بندی می‌توان به موارد زیر اشاره کرد:

رگرسیون

برخلاف مسائل دسته‌بندی، در «رگرسیون» (Regression) مقادیر خروجی پیوسته بوده و با مقادیر عددی به نمایش گذاشته می‌شوند. پیش‌بینی قیمت خانه بر اساس اندازه، موقعیت مکانی و امکانات یا پیش‌بینی میزان فروش یک محصول خاص نمونه‌هایی از مسائل رگرسیون هستند. الگوریتم‌های رگرسیون ویژگی‌های ورودی را با مقادیر عددی پیوسته تطبیق می‌دهند. در زیر برخی از انواع رایج رگرسیون را فهرست کرده‌ایم:

یادگیری نظارت شده و رگرسیون

مزایای یادگیری ماشین نظارت شده

از جمله مزایای روش‌های یادگیری نظارت شده می‌توان به موارد زیر اشاره کرد:

  • از آن‌جایی که آموزش مدل‌های نظارت شده با داده‌های برچسب‌دار انجام می‌شود، دقت عملکرد نهایی بالا خواهد بود.
  • فرایند تصمیم‌گیری در مدل‌های نظارت شده اغلب قابل درک و تفسیر است.
  • به‌منظور ذخیره زمان و منابع، می‌توان از مدل‌های نظارت شده و از پیش آموزش دیده در کاربردهای متفاوت دیگری نیز استفاده کرد.

معایب یادگیری ماشین نظارت شده

یادگیری ماشین نظارت شده معایبی نیر دارد که چند نمونه از آن‌ها را فهرست کرده‌ایم:

  • یادگیری نظارت شده در تشخیص الگوها با محدودیت مواجه است و شاید نتواند الگوهای نا آشنا و جدیدی را که در مجموعه آموزشی وجود نداشته‌اند به‌درستی پیش‌بینی کند.
  • پیچیدگی زمانی و هزینه زیاد ناشی از داده‌های برچسب‌گذاری شده، یکی دیگر از معایب یادگیری نظارت شده است.
  • از عملکرد ضعیف در تعمیم آموخته‌ها به داده‌های جدید یا همان «عمومی‌سازی» (Generalization) به عنوان نمونه‌ای دیگر از معیاب یادگیری نظارت شده یاد می‌شود.

کاربردهای یادگیری ماشین نظارت شده

یادگیری ماشین نظارت شده در کابردهای متنوعی مورد استفاده قرار می‌گیرد:

  • «دسته‌بندی تصویر» (Image Classification): شناسایی اشیاء، چهره‌ها و دیگر ویژگی‌های موجود در تصاویر.
  • «پردازش زبان طبیعی» (Natural Language Processing): استخراج اطلاعاتی همچون احساسات، موجودیت‌ها و روابط از متن.
  • «تشخیص گفتار» (Speech Recognition): تبدیل زبان محاوره به متن.
  • «سیستم‌های توصیه‌گر» (Recommendation Systems): ارائه پیشنهادات شخصی‌سازی شده به کاربران.
  • «تحلیل‌های پیشگویانه» (Predictive Analytics): پیش‌بینی خروجی‌هایی مانند میزان فروش، نرخ بازگشت مشتری و قیمت سهام.
  • «تشخیص پزشکی» (Medical Diagnosis): شناسایی انواع بیماری و دیگر شرایط پزشکی.
  • «تشخیص کلاهبرداری» (Fraud Detection): کشف و تشخیص تراکنش‌های جعلی.

  • «اتومبیل‌های خودران» (Autonomous Vehicles): در لحظه واکنش نشان دادن و تشخیص موانع جاده.
  • «تشخیص ایمیل‌های اسپم» (Email Spam Detection): جداسازی ایمیل‌های عادی از اسپم.
  • «کنترل کیفیت در تولید» (Quality Control in Manufacturing): ارزیابی کیفیت محصول و معایب آن.
  • «رتبه‌بندی اعتبار» (Credit Scoring): ارزیابی احتمال عدم پرداخت به موقع وام توسط فرد وام گیرنده.
  • «بازی» (Gaming): تشخیص کاراکترها، بررسی رفتار بازیکنان و ساخت «کاراکترهای غیر بازیکن» (Non-Player Characters | NPCs).
  • «خدمات مشتریان» (Customer Support): خودکارسازی وظایف مرتبط با خدمات مشتریان.
  • «پیش‌بینی آب‌وهوا» (Weather Forecasting): پیش‌بینی دما، میزان بارش و دیگر پارامترهای هواشناختی.
  • «تجزیه و تحلیل ورزشی» (Sports Analytics): بررسی عملکرد بازیکنان، پیش‌بینی نتیجه و بهینه‌سازی استراتژی‌های بازی.

یادگیری ماشین نظارت نشده چیست؟

از جمله انواع یادگیری ماشین که در آن مدل، الگوها و روابط را از طریق داده‌های بدون برچسب کشف می‌کند، «یادگیری نظارت نشده» (Unsupervised Learning) می‌گویند. نحوه کارکرد این روش با یادگیری نظارت شده متفاوت است و داده‌های ورودی شامل خروجی‌های برچسب‌گذاری شده نمی‌شوند. هدف اصلی یادگیری نظارت شده شناسایی الگوهای پنهان، شباهت‌ها یا طبقه‌بندی مجموعه‌داده به گونه‌ایست که در کابردهایی همچون «بازیابی داده» (Data Exploration)، «مصورسازی» (Visualization)، «کاهش ابعاد» (Dimensionality Reduction) و سایر موارد مشابه قابل استفاده باشد.

مثال یادگیری ماشین نظارت نشده

مجموعه‌داده‌ای را تصور کنید که شامل اقلام خریداری شده شما از فروشگاه است. تکنیک «خوشه‌بندی» (Clustering) که یکی از انواع روش های یادگیری ماشین نظارت نشده است، در این مسئله به کار آمده و با طبقه‌بندی الگوهای خرید یکسان میان شما و سایرین، بدون نیاز به پاسخ یا برچسب‌های از پیش تعیین شده، مشتری‌های بالقوه را شناسایی می‌کند. کسب‌وکارها با کمک این اطلاعات، جامعه هدف خود را پیدا کرده و نمونه‌های پرت یا به اصطلاح Outliers را جدا می‌کنند. انواع یادگیری ماشین نظارت نشده از دو گروه زیر تشکیل می‌شود:

  • روش «خوشه‌بندی» (Clustering)
  • روش «انجمنی» (Association)

یادگیری نظارت نشده

مثال یادگیری نظارت نشده

هر یک از این روش‌ها کاربرد خاص خود را داشته که در ادامه به شرح هر کدام می‌پردازیم.

روش خوشه‌بندی

فرایند طبقه‌بندی نقاط داده بر اساس میزان شباهت آن‌ها در به اصطلاح تعدادی خوشه را ، روش «خوشه‌بندی» (Clustering) می‌نامند. در این روش، بدون نیاز به نمونه‌های برچسب‌گذاری شده، الگوها و روابط ارزشمند میان داده‌ها شناسایی و کشف می‌شوند. در فهرست زیر برخی از رایج‌ترین انواع روش خوشه‌بندی را ملاحظه می‌کنید:

  • الگوریتم «خوشه‌بندی K میانگین» (K-Means Clustering)
  • الگوریتم خوشه‌بندی Mean-shift
  • الگوریتم DBSCAN
  • «تحلیل مؤلفه اصلی» (Principal Component Analysis | PCA)
  • «تحلیل مؤلفه مستقل» (Independent Component Analysis | ICA)

روش انجمنی

از جمله انواع یادگیری ماشین نظارت نشده که وظیفه آن کشف روابط میان نمونه‌های یک مجموعه‌داده است. در روش انجمنی، قواعدی برای تخمین احتمال وجود یک نمونه بر اساس نمونه‌ای دیگر تعریف می‌شوند. به عنوان چند مورد از انواع روش های یادگیری ماشین انجمنی، می‌توان به الگوریتم‌های زیر اشاره کرد:

  • الگوریتم «اپریوری» (Apriori)
  • الگوریتم Eclat
  • الگوریتم FP-growth

مزایای یادگیری ماشین نظارت نشده

انواع یادگیری ماشین نظارت نشده مزایایی دارد که در زیر تعدادی از آن‌ها را فهرست کرده‌ایم:

  • یادگیری نظارت نشده به کشف الگوهای پنهان و روابط مختلف میان داده‌ها کمک می‌کند.
  • از یادگیری نظارت نشده در کاربردهایی مانند «بخش‌بندی مشتریان» (Customer Segmentation)، «تشخیص ناهنجاری» (Anomaly Detection) و بازیابی داده استفاده می‌شود.
  • در یادگیری نظارت شده نیازی به داده‌های برچسب‌گذاری شده نیست؛ از همین‌رو، مرحله برچسب‌گذاری داده‌ها کنار گذاشته می‌شود.
تصویری از پازل های مختلف و چرخ دنده ها در کنار یکدیگر

معایب یادگیری ماشین نظارت نشده

به عنوان برخی از معایب روش های یادگیری نظارت نشده می‌توان به موارد زیر اشاره کرد:

  • ممکن است سنجش کیفیت خروجی مدل یادگیری ماشین، بدون استفاده از برچسب دشوار باشد.
  • درک نحوه کارکرد روش خوشه‌بندی چندان راحت نیست و تفسیرپذیری بالایی ندارد.
  • یادگیری نظارت نشده از تکنیک‌هایی همچون «خودرمزگذار» (Autoencoder) و کاهش ابعاد تشکیل شده است که به‌منظور استخراج ویژگی از داده‌های خام مورد استفاده قرار می‌گیرند.

کاربردهای یادگیری ماشین نظارت نشده

یادگیری نظارت نشده کاربردهای فراوانی دارد؛ از جمله:

  • خوشه‌بندی: گروه‌بندی نقاط داده مشابه در خوشه‌های یکسان.
  • تشخیص ناهنجاری: شناسایی نمونه‌های پرت یا ناهنجاری‌های موجود در مجموعه‌داده.
  • کاهش ابعاد: حفظ اطلاعات ضروری همزمان با کاهش ابعاد داده‌ها.
  • سیستم‌های توصیه‌گر: پیشنهاد محصول، فیلم یا محتوایی مطابق با سلیقه و اولویت‌های کاربران.
  • «مدل‌سازی موضوعی» (Topic Modeling): کشف موضوعات نهفته در مجموعه اسناد.
  • «تخمین چگالی» (Density Estimation): مورد استفاده در تخمین چگالی مجموعه‌داده.
  • فشرده‌سازی ویدئو و تصویر: کاهش حافظه ذخیره‌سازی مورد نیاز محتوای چندرسانه‌ای.

  • «پیش‌پردازش داده» (Data Preprocessing): موثر در اعمالی همچون «پاک‌سازی داده» (Data Cleaning)، «جانهی» (Imputation)، بررسی «مقادیر ناموجود» (Missing Values) و «مقیاس‌بندی داده» (Data Scaling).
  • «تحلیل سبد بازار» (Market Basket Analysis): کشف پیوستگی میان محصولات.
  • «تجزیه و تحلیل داده‌های حوزه ژنوم‌شناسی» (Genomic Data Analysis): شناسایی ژن‌هایی که الگوی مشابهی دارند.
  • «قطعه‌بندی تصویر» (Image Segmentation): قطعه‌بندی تصاویر به بخش‌هایی معنی‌دار.
  • شناسایی جوامع در شبکه‌های اجتماعی: کشف و شناسایی جوامع یا گروه‌هایی با علایق و ارتباطات یکسان.
  • بررسی رفتار مشتری: پرده‌برداری از الگوها و اطلاعات ارزشمند برای بازاریابی و توصیه محصول بهتر.
  • پیشنهاد محتوا: دسته‌بندی و نشانه‌گذاری محتوا برای پیشنهاد آسان‌تر محصولات مشابه به کاربران.
  • «تحلیل داده اکتشافی» (Exploratory Data Analysis | EDA): آشنایی بیشتر با مجموعه‌داده، پیش از تعریف مسئله هدف.

یادگیری ماشین نیمه نظارت شده

همان‌طور که از اسمش پیداست، یادگیری ماشین نیمه نظارت شده به نوعی میانگین دو روش نظارت شده و نظارت نشده است و در نتیجه هم از داده‌های برچسب‌گذاری شده و هم بدون برچسب استفاده می‌کند. بیشترین کاربرد یادگیری نیمه نظارت شده هنگامی است که جمع‌آوری داده‌های برچسب‌گذاری شده هزینه‌بر بوده و به منابع زیادی نیاز باشد. زمانی استفاده از این روش پیشنهاد می‌شود که بخش کوچکی از مجموعه‌داده برچسب‌گذاری شده و سایر نمونه‌ها بدون برچسب هستند. می‌توان ابتدا با روش‌های نظارت نشده برچسب‌ها را پیش‌بینی کرد و سپس از برچسب‌های حاصل شده در الگوریتم‌های نظارت شده استفاده کرد. داده‌های تصویری به‌خاطر ضعف در برچسب‌گذاری کامل نمونه‌ها، از جمله رایج‌ترین کاربردهای یادگیری نیمه نظارت شده هستند.

تصویری برای نمایش یادگیری نیمه نظارت شده که داده‌های ورودی،‌ مدل‌های یادگیری ماشین و خروجی یا همان پیش بینی را نشان می دهد
مثال یادگیری نیمه نظارت شده

مثال یادگیری ماشین نیمه نظارت شده

فرض کنید می‌خواهیم مدلی برای ترجمه زبان طراحی کنیم. آماده‌سازی ترجمه‌های برچسب‌گذاری شده برای همه جفت عبارت‌ها به منابع محاسباتی زیادی نیاز دارد. در این مثال، یادگیری نیمه نظارت شده از داده‌های بدون برچسب و برچسب‌دار یاد گرفته و عملکرد خود را بهبود می‌بخشد. روشی که باعث پیشرفت قابل توجهی در کیفیت سرویس‌های ترجمه زبانی شده است.

انواع یادگیری ماشین نیمه نظارت شده

انواع روش های یادگیری ماشین نیمه نظارت شده بسیاری وجود داشته که در ادامه، برخی از رایج‌ترین آن‌ها را فهرست کرده‌ایم:

  • یادگیری نیمه نظارت شده «مبتنی‌بر گراف» (Graph-Based): در این روش از گراف برای نمایش ارتباط میان نقاط داده استفاده می‌شود؛ سپس از طریق گراف، برچسب‌ها از داده‌های برچسب‌گذاری شده به نقاط داده بدون برچسب بسط داده می‌شوند.
  • روش «انتشار برچسب» (Label Propagation): در روش انتشار برچسب، بر اساس شباهت میان نقاط داده، برچسب‌ها از داده‌های برچسب‌دار به داده‌های بدون برچسب بسط داده می‌شوند.
  • روش «هم‌آموزی» (Co-training): در این روش، دو مدل یادگیری ماشین با زیرمجموعه‌های بدون برچسبِ متفاوتی آموزش داده شده و سپس هر کدام خروجی‌های دیگری را برچسب‌گذاری می‌کند.
  • روش «خودآموزی» (Self-training): خودآموزی یکی از انواع روش های یادگیری ماشین نیمه نظارت شده است که تنها یک مدل را ابتدا با داده‌های برچسب‌دار آموزش داده و از همان مدل برای پیش‌بینی برچسب داده‌های بدون برچسب استفاده می‌کند.
  • «شبکه‌های مولد تخاصمی» (Generative Adversarial Networks | GANs): نوعی الگوریتم یادگیری عمیق که در ساخت داده‌های مصنوعی از آن استفاده می‌شود. شبکه مولد تخاصمی از دو بخش «مولد» (Generator) و «متمایزگر» (Discriminator) تشکیل شده است و با آموزش دادن این دو شبکه عصبی، می‌تواند داده‌های بدون برچسب مورد نیاز یادگیری نیمه نظارت شده را تولید کند.
آیکن های مختلف یادگیری ماشین مانند مغز و لامپ و چرخ دنده که در پس زمینه ای آبی قرار دارند.

مزایای یادگیری ماشین نیمه نظارت شده

در فهرست زیر، دو نمونه از مهم‌ترین مزایای یادگیری نیمه نظارت شده را ملاحظه می‌کنید:

  • در مقایسه با یادگیری نظارت شده و از آن‌جایی که با هر دو نمونه داده برچسب‌دار و بدون برچسب آموزش می‌بیند، قابلیت تعمیم یا عمومی‌سازی بیشتری دارد.
  • گستره وسیعی از انواع داده را شامل می‌شود.

معایب یادگیری ماشین نیمه نظارت شده

یادگیری نیمه نظارت شده نیز با معایبی همراه است؛ از جمله:

  • پیاده‌سازی الگوریتم‌های نیمه نظارت شده نسبت به سایر روش‌ها پیچیده‌تر است.
  • در یادگیری نیمه نظارت شده، همچنان به نسبتی از داده‌های برچسب‌دار نیاز است که شاید همیشه در دسترس نباشند.
  • داده‌های بدون برچسب ممکن است در عملکرد مدل تاثیر منفی بگذارند.

کاربردهای یادگیری ماشین نیمه نظارت شده

در ادامه تعدادی از رایج‌ترین کاربردهای یادگیری نیمه نظارت شده را فهرست کرده‌ایم:

  • دسته‌بندی تصویر و «تشخیص اشیاء» (Object Recognition): بهبود دقت مدل‌های یادگیری ماشین از طریق ترکیب مجموعه‌ای کوچک از تصاویر برچسب گذاری شده با مجموعه‌ای بزرگ از تصاویر بدون برچسب.
  • پردازش زبان طبیعی: ارتقاء عملکرد مدل‌های زبانی با ترکیب نسبتی کم از متون برچسب‌دار با حجم زیادی از متون بدون برچسب.
  • تشخیص گفتار: بهبود دقت مدل‌های تشخیص گفتار با بهره‌گیری از تعداد محدودی از داده‌های ضبط شده و نسبت بیشتری از محتوای صوتی بدون برچسب.
  • سیستم‌های توصیه‌گر: بالا بردن عملکرد سیستم‌های توصیه‌گر شخصی‌سازی شده از طریق مجموعه «تعاملات کاربر با اقلام» (User-Item Interactions) برچسب‌گذاری شده و داده‌های رفتاری که برچسب ندارند.
  • خدمات درمانی و «تصویربرداری پزشکی» (Medical Imaging): بهره‌گیری از مجموعه کوچک تصاویر پزشکی برچسب‌گذاری شده همراه با مجموعه‌داده بزرگ تصاویر بدون برچسب، برای افزایش کیفیت تصاویر پزشکی در تجزیه و تحلیل علائم بیماری.
آیکن‌های مختلف پزشکی برای نمایش کاربرد در یادگیری ماشین که شامل نمادهای پزشک و لپ تاپ و دستگاه های پزشکی است.

یادگیری ماشین تقویتی

الگوریتم «یادگیری تقویتی» (Reinforcement Learning) از جمله انواع یادگیری ماشین است که با ایجاد «عمل» (Action) و کشف «خطا» (Error) به تعامل با محیط می‌پردازد. آزمون، خطا و تاخیر، سه ویژگی اصلی یادگیری تقویتی را تشکیل می‌دهند. در این تکنیک، عملکرد مدل با استفاده از سیستم «بازخورد پاداش» (Feedback Reward) به‌طور مداوم بهتر می‌شود. اتومبیل‌های خودران شرکت گوگل یا ربات «آلفاگو» (AlphaGo) مثال‌هایی از الگوریتم‌های یادگیری تقویتی هستند. آلفاگو رباتی است که با انسان‌ها و حتی خودش رقابت کرده و به تدریح عملکرد خود را در بازی «گو» (Go) ارتقاء می‌دهد. هر بار که داده جدیدی مشاهده شود، مدل یادگیری ماشین از آن یاد گرفته و اطلاعات جدیدی به مجموعه آموزشی اضافه می‌کند. در نتیجه هر چه بیشتر یاد بگیرد، بهتر آموزش دیده و به تجربه‌اش افزوده می‌شود. در لیست زیر، به چند نمونه از رایج‌ترین الگوریتم‌های یادگیری تقویتی اشاره شده است:

  • الگوریتم Q-Learning: الگوریتمی فاقد مدل که با تطبیق دادن هر «شرایط» (State) به «عمل» (Action) متناظر، تابعی به نام Q را یاد می‌گیرد.
  • الگوریتم SARSA: در این روش نیز مانند Q-Learning، تابعی به نام Q یاد گرفته می‌شود. گرچه برخلاف الگوریتم یادگیری Q، روش SARSA تابع Q را به‌جای عمل بهینه، برای عمل انجام شده به‌روز‌رسانی می‌کند.
  • «یادگیری Q عمیق» (Deep Q-Learning): این الگوریتم ترکیبی از الگوریتم Q-Learning و یادگیری عمیق است. روشی که از شبکه عصبی به عنوان تابع Q استفاده می‌کند. مزیت شبکه عصبی در یادگیری الگوهای پیچیده میان شرایط و عمل خلاصه می‌شود.
نمودار نشان دهنده یادگیری تقویتی
یادگیری تقویتی

مثال یادگیری ماشین تقویتی

موقعیتی را در نظر بگیرید که قصد دارید «عاملی هوشمند» (AI Agent) را برای انجام بازی مانند شطرنج آموزش دهید. عامل هوشمند در محیط حرکت کرده و بر همین اساس، بازخوردهایی مثبت یا منفی دریافت می‌کند.

انواع یادگیری ماشین تقویتی

انواع روش های یادگیری ماشین تقویتی به دو گروه «تقویت مثبت» (Positive Reinforcement) و «تقویت منفی» (Negative Reinforcement) تقسیم می‌شوند که در ادامه این مطلب از مجله فرادرس، شرح مختصری از هر کدام ارائه می‌دهیم.

تقویت مثبت

روش تقویت مثبت را می‌توان با ویژگی‌های زیر تعریف کرد:

  • پاداش دادن به عامل هوشمند برای انجام عملی خاص.
  • تشویق عامل به تکرار رفتار. مانند جایزه دادن به سگ برای نشستن، در تقویت مثبت نیز به ازای هر پاسخ درست، به عامل امتیاز مثبت داده می‌شود.

تقویت منفی

نوع یادگیری تقویت منفی از طریق ویژگی‌های زیر قابل تعریف است:

  • حذف محرک‌های نامطلوب برای ارزش دادن به نوعی از رفتار.
  • تنبیه کردن عامل به‌منظور جلوگیری از تکرار عمل. مانند خاموش کردن آژیر هنگام فشردن یک دکمه، عامل هوشمند نیز با تکمیل کاری که به آن محول شده، از امتیاز منفی جلوگیری می‌کند.

مزایای یادگیری ماشین تقویتی

از جمله مزایای یادگیری تقویتی می‌توان به موارد زیر اشاره کرد:

  • وجود تصمیم‌گیری مستقل و مناسبی که مانند ربات‌های هوشمند، دنباله‌ای از تصمیمات را یاد می‌گیرد.
  • مناسب برای اهدف بلندمدتی که دستیابی به آن‌ها دشوار است.
  • قابل استفاده در حل مسائل پیچیده‌ای که از طریق تکنیک‌های رایج قابل حل نیستند.
مزایای یادگیری ماشین تقویتی
آیکن های مختلف یادگیری ماشین که شامل تصاویر لامپ و مانیتور و لپ و موبایل و … است.

معایب یادگیری ماشین تقویتی

برخی از معیاب یادگیری ماشین تقویتی را در زیر فهرست کرده‌ایم:

  • آموزش عامل‌های هوشمند ممکن است از نظر زمانی و محاسباتی هزینه‌بر باشد.
  • استفاده از یادگیری تقویتی برای حل مسائل ساده پیشنهاد نمی‌شود.
  • نیاز به داده‌های زیاد و در نتیجه منابع قدرتمند، گاهی یادگیری تقویتی را به گزینه‌ای ناکارآمد تبدیل می‌کند.

کابردهای یادگیری ماشین تقویتی

موارد زیر تنها چند نمونه از کاربردهای یادگیری تقویتی هستند:

  • بازی‌های کامپیوتری: با استفاده از یادگیری ماشین تقویتی می‌توان نحوه انجام بازی‌های کامپیوتری، حتی از نوع پیچیده و سخت آن را به عامل‌های هوشمند آموزش داد.
  • رباتیک: خودکارسازی کارهای روزمره با آموزش دادن ربات‌ها.
  • «وسایل نقلیه خودران» (Autonomous Vehicles): کمک به اتومبیل‌های خودران برای جابه‌جایی و تصمیم‌گیری.
  • سیستم‌های توصیه‌گر: بهبود عملکرد الگوریتم‌های توصیه‌گر از طریق یادگیری اولویت‌های کاربری.
  • خدمات درمانی: بهینه‌سازی طرح درمان و اکتشافات دارویی.
  • پردازش زبان طبیعی: قابل استفاده در «سیستم‌های مکالمه‌ای» (Dialogue Systems) و چت‌بات‌ها.
  • امور مالی و تجارت: بهبود دقت «معاملات الگوریتمی» (Algorithmic Trading).

  • زنجیره تأمین و «مدیریت انبار» (Inventory Management): بهینه‌سازی فرایندهای مورد استفاده در زنجیره تأمین.
  • مدیریت انرژی: بهینه‌سازی مصرف انرژی.
  • هوش مصنوعی در بازی‌های کامپیوتری: ساخت NPC یا کاراکترهای غیر بازیکن هوشمند و تعاملی در بازی‌های ویدئویی.
  • «دستیار شخصی» (Personal Assistant): بهبود کارکرد دستیارهای شخصی.
  • «واقعیت مجازی» (Virtual Reality | VR) و «واقعیت افزوده» (Augmented Reality | AR): خلق تجربیات تعاملی و جالب توجه.
  • «کنترل صنعتی» (Industrial Control): بهینه‌سازی عملیات‌های صنعتی.
  • آموزش و پرورش‌: ساخت سیستم‌های یادگیری تطبیق‌پذیر.
  • کشاورزی: افزایش کارآمدی فرایندهای کشاورزی.

سوالات متداول

پس از آشنایی با انواع یادگیری ماشین، حال زمان خوبی است تا در این بخش به تعدادی از پرسش‌های متداول در این زمینه پاسخ دهیم.

یادگیری نظارت شده با چه چالش‌هایی روبه‌رو است؟

«عدم توازن کلاسی» (Class Imbalance)، کمبود داده‌های برچسب‌گذاری شده با کیفیت و مشکل «بیش‌برازش» (Overfitting) که موجب عملکرد ضعیف مدل نسبت به داده‌های جدید می‌شود، چند نمونه از چالش‌های یادگیری نظارت شده هستند.

یادگیری نظارت شده در چه زمینه‌ای کاربرد دارد؟

از انواع یادگیری ماشین نظارت شده در موضوعاتی همچون تحلیل ایمیل‌های اسپم، «تشخیص تصویر» (Image Recognition) و «تجزیه و تحلیل احساسات» (Sentiment Analysis) استفاده می‌شود.

چه چشم‌اندازی برای آینده یادگیری ماشین قابل تصور است؟

می‌توان متصور شد که انواع یادگیری ماشین قرار است نقش چشمگیری در زمینه‌هایی مانند پیش‌بینی و تحلیل آب‌وهوا، سیستم‌های درمانی و مدل‌سازی خودکار ایفا کنند.

تصویر یادگیری ماشین برای هوش مصنوعی که تصویر انسان را به همراه المان‌های انتزاعی نشان می‌دهد.

به‌طور کلی انواع یادگیری ماشین به چند دسته تقسیم می‌شوند؟

انواع روش های یادگیری ماشین را می‌توان در سه گروه کلی یادگیری نظارت شده، یادگیری نظارت نشده و یادگیری تقویتی دسته‌بندی کرد.

چه الگوریتم هایی در یادگیری ماشین بیشترین استفاده را دارند؟

الگوریتم‌هایی که در فهرست زیر آورده‌ایم، چند نمونه از الگوریتم‌های مورد استفاده در یادگیری ماشین هستند:

  • رگرسیون خطی
  • رگرسیون لجستیک
  • ماشین بردار پشتیبان یا SVM
  • الگوریتم K-نزدیک‌ترین همسایه یا KNN
  • درخت تصمیم
  • جنگل تصادفی
  • «شبکه‌های عصبی مصنوعی» (Artificial Neural Networks | ANNs)

الگوریتم‌های یادگیری ماشین زیادی وجود دارند و روز به روز نیز به تعداد آن‌ها اضافه می‌شود. با این حال، مواردی که در فهرست بالا به آن‌ها اشاره کردیم، برخی از رایج‌ترین‌های این زمینه هستند.

جمع‌بندی

هر یک از انواع روش های یادگیری ماشین اهداف مختص به خود را داشته و همه در بهبود عملکرد نهایی مدل‌های یادگیری سهیم هستند. همان‌طور که در این مطلب از مجله فرادرس خواندیم، یادگیری ماشین انواع مختلفی داشته که بسته به نوع مسئله و مجموعه‌داده‌ها، در کاربردهای متنوعی مورد استفاده قرار می‌گیرند. تاثیر انواع یادگیری ماشین به اندازه‌ایست که باعث تحول حوزه‌هایی مانند علم داده شده و امکان مدیریت پایگاه‌های داده حجیم و بزرگ را برای ما مهیا ساخته است.

source

توسط expressjs.ir