هوش مصنوعی به دلیل پیشرفتهای اخیر، به موضوعی محبوب تبدیل شده است. حتی افرادی که در مورد این فناوری اطلاعات زیادی ندارند، با نام آن آشنا هستند. هنگامی که به علم هوش مصنوعی اشاره میشود، مفهوم یادگیری ماشین به عنوان یکی از مهمترین زیر شاخههای این علم از ذهن هر فرد آشنا با علم هوش مصنوعی عبور میکند. در دهههای اخیر، با پیشرفتهای سریع در حوزه فناوری و علوم کامپیوتر، یادگیری ماشین به یکی از مهمترین زمینههای تحقیقاتی و کاربردی به تبدیل شده است. یکی از پایهایترین عوامل موفقیت در این زمینه، نقش شبکه عصبی در یادگیری ماشین است. شبکههای عصبی الهام گرفته از مغز انسان، نقش بسیار زیادی در توسعه الگوریتمها و پیشرفت تکنولوژی یادگیری ماشین داشتهاند. مغز انسان به عنوان پیچیدهترین عضو در بدن انسان شناخته میشود که نقش بسیار حیاتی در تفکر، درک محیط اطراف، و تصمیمگیری دارد. راز قدرت این عضو در واحدهای سلولی به نام نورونها یا سلولهای عصبی نهفته است.
از دهه ۱۹۵۰، دانشمندان به دنبال تقلید عملکرد نورون برای ساخت رباتهای هوشمندتر بودند. پس از سالها تلاش و آزمون و خطا، در سال ۲۰۰۰، انسانها با کمک شبکههای عصبی عمیق، توانایی تشخیص تصاویر و ویدیوهای مختلف را به دست آوردند. در این مطلب از مجله فرادرس، ابتدا به تعریف مفاهیم هوش مصنوعی، یادگیری ماشین و شبکه عصبی میپردازیم. سپس، نقش شبکه عصبی در یادگیری ماشین را با مقایسه با سایر روشهای یادگیری ماشین بررسی خواهیم کرد.
تفکیک مفاهیم در هوش مصنوعی
در علم هوش مصنوعی مفاهیم زیادی وجود دارد که در برخی موارد ممکن است تعاریف دقیقی از هر یک در ذهن ما صورت نگرفته باشد. به عبارت دیگر اصطلاحات زیادی در این زمینه وجود دارند که ممکن است مشابه به نظر برسند، اما با نگاهی دقیقتر، متوجه شویم که این تعاریف، کاملاً دقیق نیستند. بنابراین، در ابتدای مطلب و قبل از بررسی نقش شبکه عصبی در یادگیری ماشین، بهتر است به تعریف دقیقتر برخی مفاهیم بپردازیم.
با توجه به تصویر آورده شده نگاهی کنیم به مفاهیم فهرست زیر خواهیم داشت.
- هوش مصنوعی : هوش مصنوعی علم و مهندسی ساخت ماشینهای هوشمند ، به ویژه برنامههای کامپیوتری هوشمند است. در این حوزه محققان با روشهای نوآورانه سیستمهایی را طراحی میکنند که قادر به انجام وظایف هوشمندانه باشند.
- یادگیری ماشین: یادگیری ماشین، زیرمجموعهای از از علم هوش مصنوعی است که از الگوریتمها برای طراحی مدلهایی استفاده میکند که میتوانند به طور خودکار از دادهها یاد بگیرند و الگوها را تشخیص دهند. این مدلها میتوانند برای شناسایی یا پیشبینی مسائل مختلف استفاده شوند.
- شبکههای عصبی: شبکههای عصبی، زیرشاخهای از علم یادگیری ماشین هستند که از ساختار و عملکرد مغز انسان و شبکههای عصبی بیولوژیکی الهام گرفتهاند. اینشبکهها از نورونهای مصنوعی برای پردازش دادهها استفاده و به وسیلهٔ وزنها و اتصالات میان نورونها، الگوها را مدل میکنند.
- یادگیری عمیق: یادگیری عمیق زیر شاخه ای از یادگیری ماشین است که شبکهعصبی اجزای سازنده آن را تشکیل میدهند.در یادگیری عمیق، شبکههای عصبی دارای تعداد زیادی لایه مخفی هستند. لایه مخفی یک لایه از نورونها است که بین لایه ورودی و لایه خروجی قرار دارد. به عبارتی دیگر، آنچه که یادگیری عمیق را از مفهوم شبکه عصبی جدا میکند تعداد لایههای بیشتر آن است.
توجه به این نکته ضروری است که در برخی از مطالب علمی، عبارتهای «شبکه عصبی» و «یادگیری عمیق» به جای هم استفاده میشوند که میتواند منجر به گمراهی خواننده شود. در یادگیری عمیق، اغلب از شبکههای عصبی عمیق استفاده میشود که شامل تعداد زیادی لایههای عصبی است. به طور کلی، افزایش تعداد لایهها و نورونها در شبکههای عصبی میتواند به مدل این امکان را بدهد که اطلاعات پیچیدهتر و سطوح انتزاع بالاتری از دادهها را یاد بگیرد. اما این نکته نیز مهم است که معمولاً با افزایش پیچیدگی ساختار شبکه، نیاز به حجم دادههای آموزشی بیشتر و قدرت پردازش بیشتری نیز احساس میشود.
ما در تمام این مطلب به طور کلی، از عبارت «شبکه عصبی» برای روانتر شدن و سادگی بیشتر متن استفاده میکنیم که یک ساختار کلی برای این زیر شاخه از علم هوش مصنوعی به شمار میآید. اما، در همین ابتدای مطلب بهتر است به خاطر داشته باشیم که واژه «عمیق» (Deep) در «یادگیری عمیق» (Deep Learning) به عمق لایههای شبکه عصبی اشاره دارد و شبکه عصبی که از بیش از ۳ لایه یا بیشتر تشکیل شده است – که ورودیها و خروجیها را هم شامل میشود – میتواند به عنوان یک الگوریتم یادگیری عمیق در نظر گرفته شود. در ادامه به برخی تعاریف برخی از مفاهیم و تفاوتهای آنها میپردازیم.
نقش شبکه عصبی در یادگیری ماشین چیست؟
تا اینجا، سعی کردیم برخی از اصطلاحات مهم هوش مصنوعی را به طور خلاصه توضیح دهیم و تفاوت برخی از مفاهیم را به صورت علمی و دقیق ارائه دهیم. حال نوبت به این میرسد که نقش شبکه عصبی در یادگیری ماشین را مورد بررسی قرار دهیم، به طور کلی، یکی از پیشرفتهای مهم در حوزه علومکامپیوتر، توسعه الگوریتمهای یادگیری ماشین بوده است. با افزایش حجم دادهها و تنوع اطلاعات، نیاز به استفاده از روشهای یادگیری ماشین نیز افزایش یافته است. در همین راستا، یکی از الگوریتمهای بسیار محبوب و گسترده در زمینه یادگیری ماشین، شبکههای عصبی هستند.
شبکه عصبی چیست؟
به زبان ساده، شبکه عصبی مجموعهای از الگوریتمها است که عملکرد مغز انسان را تقلید میکند. این شبکهها بر اساس ساختار و عملکرد مغز انسان مدلسازی و از گرههای به هم پیوسته به نام نورونها تشکیل شدهاند که برای پردازش و تحلیل دادهها مورد استفاده قرار میگیرند.

در قلب شبکه عصبی، نورون قرار دارد که سیگنالهای ورودی را دریافت میکند، آنها را پردازش و سیگنال خروجی را تولید میکند. شبکههای عصبی از لایههای مختلفی از نورونها تشکیل شدهاند که هر لایه وظیفه خاصی در فرآیند یادگیری دارد. تصویر زیر معماری شبکه عصبی را نمایش میدهد.

شبکه عصبی از سه جزء اصلی تشکیل شده است.
- لایه ورودی: این لایه وظیفه دریافت دادههای اولیه ورودی به شبکه را دارد.
- لایههای پنهان: این نوع لایهها، بین لایه ورودی و لایه خروجی قرار میگیرند و محاسبات اصلی شبکه در همین لایهها انجام میشوند.
- لایه خروجی: نتیجه نهایی برای ورودیهای داده شده توسط کاربر تولید میشود.
نقش نورونها
نورونها بلوکهای سازنده شبکههای عصبی هستند که سیگنالهای ورودی را دریافت میکنند، محاسبات را انجام میدهند و خروجی را ارسال میکنند. در یک شبکه عصبی مصنوعی، نورونها با توابع ریاضی نشان داده میشوند. این توابع میانگین وزندار ورودیها را میگیرند و با استفاده از یک تابع فعال سازی، خروجی هر نورون را تعیین میکنند.
آموزش در شبکههای عصبی
شبکه عصبی با استفاده از الگوریتم «پس انتشار» (Backpropagation) ، وزنهای اتصالات بین نورونها را تنظیم میکند تا خروجی پیشبینیشده آن به خروجی واقعی نزدیکتر شود. با تکرار این فرآیند با تعداد زیادی مثال، شبکه یاد میگیرد که پیشبینیهای دقیق انجام دهد.
لایههای یادگیری
لایههای پنهان نقش مهمی در فرآیند یادگیری دارند. این لایهها وظیفه استخراج ویژگیهای پیچیده از دادههای ورودی را بر عهده دارند. هر لایه ورودیهای لایه قبلی را دریافت میکند، محاسبات را انجام میدهد و نتایج را به لایه بعدی منتقل میکند. هر چه شبکه عمیقتر باشد، ویژگیهای انتزاعی و سطح بالاتری میتواند یاد بگیرد. این یادگیری سلسله مراتبی به شبکههای عصبی اجازه میدهد تا الگوها را در سطوح مختلف پیچیدگی تشخیص دهند.
انواع شبکههای عصبی
در این قسمت به برخی از انواع شبکههای عصبی پرکاربرد به طور خلاصه اشاره کردهایم.
کاربردهای شبکههای عصبی
شبکههای عصبی در طیف گستردهای از زمینهها از جمله پردازش تصویر و زبان طبیعی و غیره کاربرد دارند. در ادامه به چند نمونه از کاربردهای شبکههای عصبی اشاره میکنیم.
- شناسایی تصویر: شبکههای عصبی با دقت بالایی میتوانند اشیاء، چهرهها و الگوهای موجود در تصاویر را شناسایی کنند. آنها پیشرفتهای چشمگیری را در برنامههایی مانند تشخیص چهره، تشخیص اشیا و خودروهای خودران ایجاد کردهاند.
- پردازش زبان طبیعی: شبکههای عصبی میتوانند به تولید سیستمهایی کمک کنند که زبان انسان را درک و تولید میکنند. این سیستمها میتوانند در کاربردهای مختلفی مانند رباتهای گفتگو، خدمات ترجمه و تحلیل احساسات استفاده شوند.
- تحلیل بازارهای مالی: با استفاده از شبکههای عصبی میتوان مقادیر زیادی از دادههای مالی را برای پیشبینی قیمت سهام و بهینهسازی روشهای سرمایه گذاری تجزیه و تحلیل کرد.
- پزشکی: در تصویربرداری پزشکی از شبکههای عصبی برای تشخیص زودهنگام بیماریها و همچنین کشف دارو استفاده میکنند.
- رباتیک: شبکههای عصبی در رباتیک برای بهبود ادراک، کنترل و تصمیمگیری استفاده میشوند و به رباتها کمک میکنند تا در محیطهای پویا سازگار شوند و وظایف پیچیدهای را انجام دهند.

تفاوت یادگیری ماشین و شبکه عصبی در چیست؟
شبکههای عصبی به عنوان زیرشاخهای از علم یادگیری ماشین مطرح هستند که بر اساس ساختار مشابه به شبکههای عصبی در مغز انسان عمل میکنند. در مقایسه با روشهای کلاسیک یادگیری ماشین، شبکههای عصبی از توانایی بیشتری برای یادگیری الگوهای پیچیده در دادهها برخوردارند. در ادامه به برخی از تفاوتها بین شبکههای عصبی و روشهای کلاسیک یادگیری ماشین میپردازیم.
یادگیری ماشین کلاسیک
مدلهای کلاسیک یادگیری ماشین بر اساس تکنیکهای آماری و قوانین از پیش تعیین شده طراحی شدهاند و معمولاً تنظیم پارامترهای این دسته از مدلها توسط متخصصان یادگیری ماشین انجام میشود. به طور کلی، مدلهای کلاسیک یادگیری ماشین برای پردازش دادههای ساختاریافته مانند اعداد هستند. الگوریتمهای یادگیری ماشین کلاسیک میتوانند برای حل مسائل مختلفی از جمله، طبقهبندی، رگرسیون، خوشهبندی و مسائل کاهش ابعاد مورد استفاده قرار میگیرند. مثالهایی از این دسته از الگوریتمها، شامل موارد زیر میباشند.
- رگرسیون خطی: رگرسیون خطی یک الگوریتم یادگیری ماشین است که برای پیشبینی مقادیر عددی بر اساس رابطه خطی بین مقادیر مختلف استفاده میشود. به عنوان مثال، میتوان از آن برای پیشبینی قیمت خانهها بر اساس عواملی مانند اندازه، تعداد اتاق خواب و موقعیت مکانی استفاده کرد.
- رگرسیون لجستیک: رگرسیون لجستیک یک الگوریتم یادگیری ماشین است که برای پیشبینی متغیرهای وابسته گسسته، مانند پاسخهای بله یا خیر و مورد قبول یا رد شده، استفاده میشود. از رگرسیون لجستیک برای مثالهای مختلفی مانند تشخیص ایمیلهای اسپم یا غیراسپم، تشخیص بیماریها، تصمیمگیری در مورد خرید یا عدم خرید محصولات، و سایر موارد طبقهبندی استفاده میشود.
- خوشهبندی: الگوریتمهای خوشهبندی با استفاده از یادگیری بدون نظارت میتوانند بدون نیاز به برچسبها، الگوها و ساختارهای موجود در دادهها را شناسایی و گروهبندی نمایند. این الگوریتمها کمک میکنند تا اطلاعات جدیدی را از دادهها استخراج و تفاوتها و الگوهایی را کشف شوند که ممکن است توسط انسانها نادیده گرفته بشوند.
- درخت تصمیم: درختهای تصمیم میتوانند برای پیشبینی مقادیر عددی – یا همان مسئله رگرسیون- یا طبقهبندی دادهها مورد استفاده قرار گیرند. این درختها از یک دنباله از تصمیمات مرتبط تشکیل شدهاند که با یک نمودار درختی به خوبی قابل نمایش است. از مزایای اصلی درختهای تصمیم این است که آنها به راحتی قابل تفسیر هستند و شاخصهای درخت و همچنین دنبالهی تصمیمات آن به سادگی قابل درک هستند و میتوانند به صورت گرافیکی نمایش داده شوند. این خاصیت میتواند به تحلیلگران کمک کند تا فرآیند تصمیمگیری را درک کنند.
- جنگلهای تصادفی: «جنگلهای تصادفی» (Random Forests) نوعی از الگوریتمهای یادگیری ماشین هستند که از ترکیب نتایج تعدادی از درختهای تصمیم برای وظایفی نظیر پیشبینی و طبقهبندی مورد استفاده قرار میگیرند. در این دسته از روشها، پس از آموزش هر درخت، پیشبینیهای آن با نتایج سایر درختها ترکیب میشوند تا پیشبینی نهایی به دست آید.
شبکه عصبی
شبکههای عصبی به جای تکیه بر قوانین و الگوهای از پیش تعریف شده، با پردازش مقادیر زیادی داده و تنظیم وزن اتصالات بین نورونها، فرایند یادگیری را انجام میدهند. یکی از تفاوتهای اصلی بین یادگیری ماشین کلاسیک و روشهای شبکه عصبی، در نحوه استخراج ویژگی از دادههای ورودی است. در روشهای یادگیری ماشین کلاسیک، معمولاً متخصصان با استفاده از دانش خود از نوع مسئله و روشهای آماری مناسب، ویژگیهای مهم را استخراج میکنند که این ویژگیها به عنوان ورودی به مدل داده میشوند. در مقابل، در شبکههای عصبی، میتوانند به طور تقریباً خودکار ویژگیهای مهم را از دادههای ورودی استخراج کنند. این قابلیت به ویژه در شبکههای عمیق، که شامل لایههای بسیار زیادی هستند، خود را نشان میدهد. این لایهها به طور تدریجی و به صورت سلسله مراتبی ویژگیهای پیچیدهتری از دادههای ورودی استخراج میکنند. به تصویر زیر توجه کنید.

یکی از مزیتهای اصلی شبکههای عصبی، توانایی پردازش دادههای پیچیده و بدون ساختار است که مهمترین نقش شبکه عصبی در یادگیری ماشین است. برخلاف الگوریتمهای یادگیری ماشین کلاسیک که نیاز به پردازش و ساختاردهی دادهها دارند، شبکههای عصبی میتوانند دادههای خام مانند تصاویر، صدا و متن را به طور مستقیم پردازش کنند. این توانایی شبکههای عصبی را برای کاربردهایی مانند بینایی کامپیوتر، پردازش زبان طبیعی و تشخیص گفتار مناسب میسازد. به عنوان مثال، شبکههای عصبی میتوانند یاد بگیرند که اشیاء را در تصاویر تشخیص دهند، کلمات گفتاری را به متن کنند و پاسخهایی شبیه به انسان در چتباتها ایجاد کنند.
همچنین، شبکههای عصبی با توانایی تجزیه و تحلیل دادهها به اجزای کوچکتر و شناخت الگوها، درک جامعی از مسائل پیچیده پیدا میکنند. به عنوان مثال، در تجزیه و تحلیل تصاویر، این شبکهها میتوانند بهتر از الگوریتمهای کلاسیک لبهها، شکلها و بافتها را شناسایی کرده و درک بهتری از تفاوتهای ظریف و پیچیدگیهای موجود در دادههای تصویری داشته باشند.
جدول زیر از مجله فرادرس، یادگیری ماشین کلاسیک با روشهای مبتنی بر شبکه عصبی را به خوبی مقایسه میکند.
ویژگی | یادگیری ماشین کلاسیک | شبکه عصبی |
نحوه استخراج ویژگی | به صورت دستی و با استفاده از دانش متخصصان | ساختارهای لایهای قادر به استخراج ویژگیها به صورت خودکار است. |
کاربردهای رایج | طبقهبندی، رگرسیون، خوشهبندی، کاهش ابعاد | طبقهبندی، رگرسیون، خوشهبندی، کاهش ابعاد |
مثالی از کتابخانههای مورد استفاده | scikit-learn | PyTorch, TensorFlow, Keras, Caffe, Theano |
حجم دادههای آموزشی | نیاز به حجم داده کمتری | نیاز به حجم داده بیشتری دارد |
دیباگ کردن | آسانتر | سختتر |
مدتزمان آموزش | کمتر | بیشتر |
توانایی در یادگیری الگوهای پیچیده | کمتر | بیشتر |
تا اینجای مطلب، سعی کردیم نقش شبکه عصبی را در یادگیری ماشین شرح دهیم. به این منظور با مفهوم شبکه عصبی آشنا شدیم و به دنبال آن نگاهی به انواع و کاربردهای آن داشتیم. در ادامه، به منظور اینکه با جایگاه شبکههای عصبی در حوزه یادگیری ماشین آشنا شویم. شبکههای عصبی را با الگوریتمهای کلاسیک یادگیری ماشین مقایسه کردیم. حال، برای اینکه مطالب را عمیقتر بیاموزید، در ادامه مطلب، میتوانید با مفاهیم هوش مصنوعی و یادگیری ماشین بیشتر آشنا شوید که شبکه عصبی زیر مجموعه این دو حوزه گسترده به شمار میآید.
هوش مصنوعی چیست؟
«هوش مصنوعی» (Artificial Intelligence| AI) علمی است که دادهها، اطلاعات و هوش انسانی را به ماشینها منتقل میکند. هدف اصلی هوش مصنوعی توسعه ماشینهای متکی به خود است که میتوانند مانند انسان فکر و عمل کنند. این ماشینها میتوانند رفتار انسان را تقلید کنند و با یادگیری و حل مسئله، وظایف را انجام دهند. بیشتر سیستمهای هوش مصنوعی هوش طبیعی را برای حل مشکلات پیچیده شبیهسازی میکنند.
انواع هوش مصنوعی
هوش مصنوعی را میتوان به ۴ دسته اصلی تقسیم کرد که در ادامه فهرست میکنیم.
- ماشینهای واکنشی: این سیستمها تنها به محرکهای خارجی پاسخ میدهند. آنها حافظه ندارند و از تجربیات گذشته خود برای تصمیمگیریهای جدید استفاده نمیکنند. نمونهای از ماشینهای واکنشی، الگوریتمهای جستجوی رباتها است که به آنها اجازه میدهد تا در محیطهای پیچیده حرکت کنند.
- ماشینهای حافظه محدود: این سیستمها اطلاعات را در حافظه کوتاهمدت خود ذخیره میکنند و میتوانند از این اطلاعات برای تصمیمگیریهای آینده استفاده کنند. آنها حافظه بلند مدت ندارند و نمیتوانند تجربیات گذشته خود را به خاطر بسپارند. نمونهای از ماشینهای حافظه محدود، سیستمهای تشخیص چهره است.
- نظریه ذهن: این سیستمها قادرند احساسات انسان را درک کنند و رفتار خود را بر اساس این درک تنظیم کنند. نمونهای از سیستمهای نظریه ذهن، رباتهای خدماتی هستند که قادرند با انسانها تعامل داشته باشند.
- خودآگاهی: سیستمهای خودآگاه طوری طراحی شدهاند که دارای توانایی درک و پردازش اطلاعات در محیط خود هستند و قابلیت انجام تصمیمات مستقل را دارند. این سیستمها از حسگرها و دادههای محیطی بهره میبرند تا وضعیت اطراف را درک کنند و بر اساس آن اقدامات مناسبی انجام دهند. نمونهای از این سیستمها خودروهای خودران است که میتوانند با توجه به محیط اطراف خود حرکت کنند و از برخورد با سایر افراد یا اشیا جلوگیری کنند.

این ۴ نوع هوش مصنوعی در حال حاضر در حال توسعه هستند و در بسیاری از زمینهها کاربرد دارند. در ادامه برخی ار کاربردها را بیان میکنیم.
- ترجمه ماشینی: سیستمهای ترجمه ماشینی مانند Google-Translate میتوانند متون را از یک زبان به زبان دیگر ترجمه کنند. این سیستمها با استفاده از الگوریتمهای پیچیده، زبان را تجزیه و تحلیل میکنند و کلمات و عبارات را مطابق با زبان مقصد بازنویسی میکنند. Google Translate یکی از محبوبترین سیستمهای ترجمه ماشینی است که میتواند بیش از ۱۰۰ زبان را ترجمه کند.
- خودرانها: خودروهای خودران مانند Waymo قادرند بدون دخالت راننده حرکت کنند. این خودروها از حسگرهای متعدد مانند دوربینها، رادار و غیره استفاده میکنند تا محیط اطراف خود را تجزیه و تحلیل کنند و تصمیم بگیرند که چگونه حرکت کنند. Waymo یکی از شرکتهای موفق در زمینه خودروهای خودران است که در حال آزمایش خودروهای خود در شهرهای ایالات متحده است.
- رباتهای هوش مصنوعی: این رباتها کارهای مختلفی مانند تعامل با انسانها و بازی انجام دهند. Sophia رباتی انسان نما است که میتواند صحبت کند، چهرهها را تشخیص دهد و حتی احساسات را بیان کند. Aibo سگی رباتیک است که میتواند با انسانها بازی کند و به آنها پاسخ دهد.
- برنامههای تشخیص صدا: برنامههای تشخیص صدا مانند Siri یا OK Google میتوانند با استفاده از میکروفونها، صدای انسان را تشخیص دهند و آن را به متن تبدیل کنند. این برنامهها میتوانند برای انجام کارهای مختلف مانند برقراری تماس تلفنی، ارسال پیام متنی یا انجام جستجو در اینترنت استفاده شوند. Siri و OK Google دو برنامه تشخیص صدای محبوب هستند که در تلفنهای هوشمند iOS و Android استفاده میشوند.
حال که درکی از هوش مصنوعی و برخی از کاربردهای آن پیدا کردیم، سراغ یادگیری ماشین میرویم و ببینیم چگونه کار میکند.
یادگیری ماشین چیست؟
یادگیری ماشین، علمی است که به مطالعه الگوریتمهایی میپردازد که با استفاده از مفاهیم آماری، مدلی را آموزش میدهد که توانایی تشخیص و تصمیمگیری داشته باشد. به عبارت دیگر، به جای اینکه قوانین به صورت مستقیم و «مبتنی بر قواعد» (Rule-Based) توسط برنامهنویس برنامهریزی شوند، سیستم به صورت خودکار با یادگیری از طریق دادههای آموزشی قوانین را پیدا میکند.
کتاب تام میچل در مورد یادگیری ماشین نوشتهاست: «به یک برنامه کامپیوتری گفته میشود که با استفاده از تجربه E – برای مثال، دادههای آموزشی- و با معیار عملکرد P، – برای مثال، دقت- سعی میکند در انجام وظیفه T بهبود پیدا کند.» به طور کلی، یادگیری ماشین به عنوان زیر مجموعه ای از هوش مصنوعی و یکی از عناصر مهم حوزه علم داده به شمار میآید.به طور کلی، علم یادگیری ماشین از الگوریتمها و روشهای آماری مدلهایی را آموزش میدهد که برای طبقهبندی یا پیش بینی و کشف الگوها در پروژههای دادهکاوی مورد استفاده قرار میگیرد.
انواع مدلهای یادگیری ماشین
در ادامه چند نوع مدل یادگیری ماشین را شرح میدهیم.
یادگیری نظارت شده
در این نوع یادگیری از مجموعه دادههای برچسبگذاری شده برای آموزش الگوریتمها به منظور طبقهبندی دادهها یا پیشبینی نتایج، استفاده میشود. زمانی که دادههای ورودی به مدل وارد میشوند. مدل بهصورت مکرر فرآیند یادگیری را تکرار میکند تا به بهترین شکل ممکن با دادهها سازگار شود و توانایی پیشبینی دادههای جدید را داشته باشد. در این مرحله، فرایند «اعتبار سنجی» (Validation) نیز انجام میشود که در آن، مدل در زمان آموزش با استفاده از دادههای اعتبارسنجی ارزیابی میشود. این کار به جلوگیری از «بیشبرازش» (Overfitting) یا «کم برازش» (Underfitting) مدل کمک میکند. یادگیری نظارتی به بسیاری از سازمانها کمک میکند تا طیف وسیعی از مسائل در مقیاس بزرگ را حل کنند. یکی از کاربردهای ساده یادگیری نظارتی، جداسازی ایمیلهای اسپم از سایر ایمیلها در پوشهای جداگانه است. برخی از روشهای مورد استفاده در یادگیری نظارتی شامل موارد زیر میباشند.
- شبکههای عصبی
- بیز ساده
- رگرسیون خطی
- رگرسیون لجستیک
- جنگل تصادفی
- بردار ماشین پشتیبان

یادگیری نظارت نشده
این دسته از روشها از الگوریتمهای یادگیری به منظور تحلیل و خوشهبندی دادههای بدون برچسب استفاده میکند و الگوهای پنهان دادهها را بدون نیاز به دخالت انسان کشف میکند. این نوع از الگوریتمهای یادگیری ماشین به دلیل توانایی کشف شباهتها و تفاوتها در اطلاعات، برای تحلیل اکتشافی دادهها (Exploratory Data Analysis)، روشهای «فروش متقابل» (Cross- selling)، تقسیمبندی مشتریان و شناسایی الگو و تصویر بسیار مناسب است. از یادگیری بدون نظارت نیز برای کاهش تعداد ویژگیها در یک مدل از طریق فرآیند کاهش ابعاد استفاده میشود. دو روش متداول برای این کاهش ابعاد، «تحلیل مولفه اصلی» (PCA| Principal Component Analysis) و «تجزیه مقادیر منفرد» ( SVD| Singular Value Decomposition) هستند. از دیگر الگوریتمهای مورد استفاده در یادگیری بدون نظارت، شامل شبکههای عصبی، خوشهبندی Kmeans و روشهای خوشهبندی احتمالی است.
یادگیری نیمه نظارتی
یادگیری نیمهنظارتی به ما این امکان را میدهد که از دو دنیای یادگیری نظارت شده و بدون نظارت به طور همزمان استفاده کنیم. این دسته از روشها میتوانند مشکل کمبود دادههای برچسبخورده برای الگوریتمهای یادگیری نظارت شده را حل کند. در واقع، یادگیری نیمهنظارتی از اطلاعات موجود در دادههای برچسبخورده بهره میبرد تا الگوها و ویژگیهای مفیدی را از دادههای بدون برچسب را استخراج کند. این روش، به ویژه زمانی بسیار مفید است که تعداد دادههای برچسب خورده کم و یا هزینه برچسبزنی به دادهها بالا باشد.
یادگیری تقویتی
یادگیری تقویتی یک مدل یادگیری ماشین است که شباهت زیادی به یادگیری نظارت شده دارد، اما این الگوریتم با استفاده از نمونه دادهها آموزش نمیبیند. این دسته از مدلها از طریق تجربه و امتحان و خطا پیشرفت میکند. دنبالهای از نتایج موفق تقویت میشوند تا بهترین سیاست برای توسعه مسئلهای خاص توسعه پیدا کند. مثالی خوب از این نوع یادگیری، سیستم IBM Watson است که در رقابت Jeopardy در سال ۲۰۱۱ برنده شد.
سوالات رایج
در ادامه به چند سوال متداول پیرامون این موضوع میپردازیم.
چرا شبکه عصبی در یادگیری ماشین مهم است؟
شبکههای عصبی میتوانند به سیستمها در تصمیمگیری هوشمندانه با کمک محدود انسانی کمک کنند. این به دلیل توانایی آنها در یادگیری و مدلسازی روابط غیرخطی و پیچیده بین دادههای ورودی و خروجی است.
مهمترین مزیت استفاده از شبکههای عصبی چیست؟
شبکههای عصبی با تقلید از معماری مغز انسان برای پردازش اطلاعات، مکانیزمی را برای سیستمها فراهم میکنند تا از دادهها یاد بگیرند، الگوها را تشخیص دهند و تصمیم بگیرند، که اغلب از رویکردهای یادگیری ماشین کلاسیک در حوزههای مختلف مانند تشخیص تصویر و گفتار، پردازش زبان طبیعی و بازی پیشی میگیرند.
جمعبندی
شبکههای عصبی یکی از عناصر اصلی یادگیری ماشین محسوب میشوند. توانایی منحصر به فرد آنها در حل مسائل پیچیده، یادگیری از تجربه، و ارائه پیشبینیهای دقیق، اهمیت بالایی برای استفاده از آنها در زمینههای مختلف ایجاد کرده است. در این مقاله از مجله فرادرس، سعی کردیم نقش شبکه عصبی در یادگیری ماشین را تشریح کنیم. در ابتدا، شبکههای عصبی را به عنوان زیرمجموعهای از علم یادگیری ماشین معرفی و سپس، تعریف یادگیری ماشین کلاسیک را ارائه دادیم و تفاوتهای آن با شبکههای عصبی را بررسی نمودهایم. در نهایت، به بررسی چند مزیت شبکههای عصبی نسبت به الگوریتمهای کلاسیک یادگیری ماشین پرداختیم.
source