لگوریتمهای یادگیری ماشین به بخشی ضروری از فناوری مدرن تبدیل شدهاند و به خودکارسازی فرآیندها و پیشبینیهای مبتنی بر دادهها کمک میکنند. یکی از وظایف مهم در یادگیری ماشین طبقهبندی یا Classification است که شامل پیشبینی کلاس یا دسته یک ورودی داده شده بر اساس ویژگیهای آن است.
طبقهبندی یا Classification نوعی یادگیری تحت نظارت (Supervised Learning) در یادگیری ماشین است که هدف آن یادگیری نگاشت بین دادههای ورودی و برچسبهای خروجی است
آکادمی سافتک
طبقهبندی در ماشین لرنینگ چیست؟
طبقهبندی یا Classification نوعی یادگیری تحت نظارت (Supervised Learning) در یادگیری ماشین است که هدف آن یادگیری نگاشت بین دادههای ورودی و برچسبهای خروجی است. دادههای ورودی معمولاً مجموعهای از ویژگیها یا فیچرهایی (Feature) هستند که ورودی را توصیف میکنند، در حالی که برچسب خروجی یک کلاس یا دسته از پیش تعریف شده است که ورودی به آن تعلق دارد. هدف الگوریتم طبقهبندی یادگیری یک مرز تصمیم است که کلاسهای مختلف را در فضای ویژگی از هم جدا میکند، به طوری که بتواند کلاس ورودیهای جدید و نادیده را بر اساس ویژگیهای آنها پیشبینی کند. به طور مثال اگر بخواهیم ایمیلهای دریافتی را به دو دسته اسپم و غیراسپم تقسیم کنیم و آنها را شناسایی کنیم، در ابتدا به مدل ماشین لرنینگ مجموعه دادهای با برچسب اسپم و غیراسپم میدهیم تا با آن آموزش ببیند و سپس از آن مدل آموزش دیده برای شناسایی یا طبقهبندی ایمیلهای جدید استفاده میکنیم. به این کار، طبقهبندی یا Classification گفته میشود.
کاربردهای طبقهبندی
طبقهبندی کاربردهای متعددی در زمینههای مختلف دارد، از جمله:
طبقه بندی تصویر: طبقه بندی تصویر برای شناسایی محتویات یک تصویر مانند وجود اشیا یا افراد استفاده میشود. به عنوان مثال، یک الگوریتم طبقه بندی تصویر را میتوان برای تشخیص انواع مختلف حیوانات، گیاهان یا وسایل نقلیه آموزش داد.
تجزیه و تحلیل احساسات: تجزیه و تحلیل احساسات برای طبقه بندی احساسات یا نظر یک متن خاص، مانند بررسی محصول یا پست رسانههای اجتماعی استفاده میشود. به عنوان مثال، یک الگوریتم تحلیل احساسات را میتوان برای طبقهبندی متن به عنوان مثبت، منفی یا خنثی آموزش داد.
تشخیص تقلب: تشخیص تقلب برای شناسایی فعالیتهای متقلبانه در تراکنشهای مالی مانند کلاهبرداری از کارت اعتباری استفاده میشود. به عنوان مثال، یک الگوریتم تشخیص تقلب میتواند آموزش داده شود تا معاملات را بر اساس ویژگیهای آنها به کلاسهای قانونی یا تقلبی طبقهبندی کند.
تشخیص پزشکی: تشخیص پزشکی برای شناسایی بیماریها یا شرایط بیمار بر اساس علائم و سوابق پزشکی او استفاده میشود. به عنوان مثال، یک الگوریتم تشخیص پزشکی میتواند آموزش داده شود تا بیماران را بر اساس علائم و سابقه پزشکی به عنوان مبتلا به یک بیماری خاص یا غیر مبتلا طبقهبندی کند.
نمونههایی از مسائل طبقهبندی
در اینجا چند نمونه از مسائل طبقه بندی در یادگیری ماشین را معرفی خواهیم کرد:
مجموعه داده Iris: مجموعه داده Iris یک مثال کلاسیک از یک مسئله طبقهبندی در یادگیری ماشین است. این شامل اندازهگیری طول کاسبرگ، عرض کاسبرگ، طول گلبرگ و عرض گلبرگ برای سه گونه مختلف گل زنبق است. تسک مورد نظر، طبقه بندی گلهای زنبق جدید به یکی از سه گونه بر اساس اندازه گیری ویژگیهای کاسبرگ آنهاست.
مجموعه داده MNIST: مجموعه داده MNIST نمونه محبوب دیگری از یک مسئله طبقهبندی است. از تعداد زیادی اعداد دست نویس تشکیل شده است و تسک مورد نظر این است که هر عدد را به یکی از ده عدد ممکن (۰تا ۹) طبقهبندی کنیم.
تشخیص سرطان سینه: تشخیص سرطان سینه یک مشکل طبقهبندی پزشکی است که شامل طبقهبندی تومورها به دو دسته بدخیم یا خوشخیم بر اساس ویژگیهای مختلف مانند اندازه، شکل و بافت تومور است.
تشخیص ایمیل هرزنامه: تشخیص ایمیل هرزنامه یا اسپم، یک مسئله طبقهبندی است که شامل طبقهبندی ایمیلها به عنوان اسپم یا غیر اسپم بر اساس محتوای آنهاست.
1 اظهار نظر