یادگیری عمیق زیرمجموعه ای از یادگیری ماشینی است که از شبکه های عصبی چند لایه به نام شبکه های عصبی عمیق برای شبیه سازی قدرت تصمیم گیری پیچیده مغز انسان استفاده می کند. نوعی از یادگیری عمیق بیشتر هوش مصنوعی (AI) را در زندگی امروز ما تقویت می کند.
با تعریف دقیق، شبکه عصبی عمیق یا DNN، یک شبکه عصبی با سه لایه یا بیشتر است. در عمل، اکثر DNN ها دارای لایه های بسیار بیشتری هستند. DNN ها بر روی مقادیر زیادی از داده ها برای شناسایی و طبقه بندی پدیده ها، تشخیص الگوها و روابط، ارزیابی احتمالات، و پیش بینی و تصمیم گیری آموزش می بینند. در حالی که یک شبکه عصبی تک لایه می تواند پیش بینی ها و تصمیم گیری های مفید و تقریبی انجام دهد، لایه های اضافی در یک شبکه عصبی عمیق به پالایش و بهینه سازی آن نتایج برای دقت بیشتر کمک می کند.
یادگیری عمیق بسیاری از برنامهها و خدماتی را هدایت میکند که اتوماسیون را بهبود میبخشد، وظایف تحلیلی و فیزیکی را بدون دخالت انسان انجام میدهد. این فناوری در پس محصولات و خدمات روزمره مانند دستیارهای دیجیتال، کنترلهای تلویزیونی با قابلیت صوتی، تشخیص تقلب در کارت اعتباری و همچنین فناوریهای نوظهور مانند خودروهای خودران و هوش مصنوعی مولد قرار دارد.
یادگیری عمیق چگونه کار می کند؟
شبکههای عصبی یادگیری عمیق یا شبکههای عصبی مصنوعی، تلاش میکنند از طریق ترکیبی از ورودی دادهها، وزنها و سوگیری از مغز انسان تقلید کنند. این عناصر برای تشخیص دقیق، طبقه بندی و توصیف اشیاء درون داده ها با هم کار می کنند.
شبکههای عصبی عمیق از چندین لایه از گرههای به هم پیوسته تشکیل شدهاند که هر کدام بر روی لایه قبلی برای اصلاح و بهینهسازی پیشبینی یا طبقهبندی ساخته میشوند. این پیشروی محاسبات از طریق شبکه، انتشار رو به جلو نامیده می شود. لایه های ورودی و خروجی یک شبکه عصبی عمیق را لایه های مرئی می نامند. لایه ورودی جایی است که مدل یادگیری عمیق داده ها را برای پردازش جذب می کند و لایه خروجی جایی است که پیش بینی یا طبقه بندی نهایی انجام می شود.
فرآیند دیگری به نام پس انتشار از الگوریتمهایی مانند نزول گرادیان برای محاسبه خطاها در پیشبینیها استفاده میکند و سپس وزنها و سوگیریهای تابع را با حرکت به سمت عقب در لایهها در تلاش برای آموزش مدل تنظیم میکند. انتشار رو به جلو و پس انتشار به یک شبکه عصبی اجازه می دهد تا پیش بینی کند و هر گونه خطا را بر این اساس تصحیح کند. با گذشت زمان، الگوریتم به تدریج دقیق تر می شود.
در بالا ساده ترین نوع شبکه عصبی عمیق را به ساده ترین عبارت توصیف می کند. با این حال، الگوریتم های یادگیری عمیق بسیار پیچیده هستند و انواع مختلفی از شبکه های عصبی برای رسیدگی به مشکلات یا مجموعه داده های خاص وجود دارد. مثلا، شبکههای عصبی کانولوشنال (CNN) که عمدتاً در برنامههای بینایی کامپیوتری و طبقهبندی تصویر استفاده میشوند، میتوانند ویژگیها و الگوهای درون یک تصویر را شناسایی کنند و کارهایی مانند تشخیص یا تشخیص اشیا را ممکن میسازند. در سال ۲۰۱۵، یک شبکه سی ان ان برای اولین بار موفق شد یک انسان را در چالش تشخیص اشیا شکست دهد.شبکه عصبی بازگشتی (RNN) معمولاً در کاربردهای زبان طبیعی و تشخیص گفتار استفاده میشود، زیرا از دادههای سری زمانی یا ترتیبی استفاده میکند.
کاربردهای دیپ لرنینگ
به تازگی، جهان تکنولوژی شاهد موج عظیمی از کاربردهای حوزه هوش مصنوعی بوده است که همگی از مدلهای یادگیری عمیق یا همان دیپ لرنینگ سرچشمه میگیرند. گستره این کاربردها از «سیستمهای توصیهگر» (Recommender System) فیلم در پلتفرم «نتفلیکس» (Netflix) تا سیستمهای مدیریت انبار شرکت «آمازون» (Amazon) ادامه دارد. حالا و پس از پاسخ دادن به پرسش دیپ لرنینگ چیست، در این بخش با چند نمونه بسیار معروف از کاربردهای دیپ لرنینگ آشنا میشویم. به این صورت، درک خوبی از توانایی و پتانسیل شبکههای عصبی عمیق بهدست میآورید.
بینایی ماشین
از جمله کاربردهای «بینایی ماشین» (Computer Vision | CV)، میتوانیم به شناسایی موانع و جلوگیری از تصادف در اتومبیلهای خودران اشاره کنیم. همچنین در کاربردهای دیگری مانند «بازشناسی چهره» (Face Recognition)، «تخمین حالت» (Pose Estimation)، «طبقهبندی تصویر» (Image Classification) و «تشخیص ناهنجاری» (Anomaly Detection) نیز از بینایی ماشین استفاده میشود.
تشخیص گفتار خودکار
روزانه میلیاردها نفر از سیستمهای «تشخیص گفتار خودکار» (Automatic Speech Recognition | ASR) بهره میبرند. فناوری که در تلفنهای همراه ما تعبیه شده و بهطور معمول با بیان عباراتی همچون Hey, Google یا Hi, Siri فعال میشود. از چنین کاربردهایی در تبدیل «متن به صدا» (Text-to-Speech)، «دستهبندی صدا» (Audio Classification) و «تشخیص تغییرات کلامی» (Voice Activity Detection) استفاده میشود.
هوش مصنوعی مولد
معرفی مدل زبانی «جیپیتی» (GPT) توسط شرکت OpenAI، جهان «هوش مصنوعی مولد» (Generative AI) را متحول کرد. امروزه میتوانید چنین مدلهایی را برای نگارش کامل یک رمان یا حتی پیادهسازی پروژههای یادگیری ماشین خود آموزش دهید.
ترجمه
منظور از «ترجمه» (Translation) تنها ترجمه زبانی نیست و روشهایی مانند «بازشناسی کاراکترهای نوری» (Optical Character Recognition | OCR)، تصاویر را به متن تبدیل میکنند یا «شبکههای مولد تخاصمی» (Generative Adversarial Networks | GANs) متنی توصیفی به عنوان ورودی دریافت کرده و تصاویر متنوعی تحویل میدهند.
تحلیل سری زمانی
از «تحلیل سری زمانی» (Time Series Forecast) در پیشبینی نوسانات بازار، قیمت سهام و تغییرات آبوهوایی استفاده میشود. بقای بخش مالی هر سازمانی به تحلیل و پیشبینی طرحهای آینده بستگی دارد. مدلهای یادگیری عمیق و سری زمانی، در فرایندهایی مانند شناسایی الگو، مهارت بیشتری نسبت به انسان دارند و به همین خاطر، نقش ابزاری اساسی را در صنایع مختلف ایفا میکنند.
خودکارسازی
یکی از رایجترین کاربردهای دیپ لرنینگ، «خودکارسازی» (Automation) فعالیتها است. به عنوان مثال، از رباتهای آموزش دیده در کارخانهها و طی مراحل مختلف تولید بهرهبرداری میشود و برخی نرمافزارها نیز میتوانند بهطور خودکار، بازیها کامپیوتری را انجام دهند.
بازخورد مشتری
از دیپ لرنینگ در مدیریت بازخورد و شکایات مشتریها استفاده میشود. در تمامی «چتباتها» (Chatbots) بخشی برای ثبت بازخورد کاربران طراحی شده است.
زیست پزشکی
حوزه «زیستپزشکی» (Biomedical) رشد زیادی را از زمان معرفی دیپ لرنینگ تجربه کرده است. کمک در تشخیص سرطان، ساخت مواد دارویی پایدار و تشخیص ناهنجاری در تصاویر پزشکی تنها چند نمونه از موارد استفاده یادگیری عمیق در زیستپزشکی است.
Deep learning applicationsمنبع : IBM