بابک نوریمقدم(دانشجوی دکتریرشته مهندسی فناوری اطلاعات- تجارت الکترونیکی)، ۱۹ تیرماه ۱۴۰۰ از رساله دکتری خود با عنوان«بهبود روشهای یادگیری دسته جمعی برای دسته بندی اشیا و به کارگیری آن در حوزه کلان داده ها»به صورت مجازی دفاع خواهد می کند. چکیده این رساله که راهنمایی ان را دکتر مهدی غضنفری و مشاوره اش را دکتر محمد فتحیان بروجنی بر عهده داشته اند به شرح زیر است. ضمنا این جلسه دفاعیه ساعت ۱۷ برگزار می شود. برای ورود به جلسه دفاع از طریق لینک زیر وارد شوید:
چکیده پیشرفت های دنیای دیجیتال در عصر فناوری اطلاعات سبب تحولات اساسی در زندگی روزمره بشر گشته است. امروز حجم انبوهی از انواع داده ها با سرعت سرسام آوری تولید و ذخیره می شوند. داده های امروزی مانند داده های میکروآرایهDNAدارای ویژگی های همچون: نامتوازن بودن، تعداد ویژگی های بسیار زیاد و ... می باشند. نحوه مدیریت چنین داده هایی سبب پیدایش بحثی با عنوان کلان داده شده است. در میان یکی از روشهای تحلیل داده، مدل یادگیری جمعی است که امروزه به دلیل ویژگی هایی همچون قابلیت تعمیم بالا، ساختار منعطف و .... در میان محققین از اقبال خوبی برخوردار شده و مطالعات بسیاری در این حوزه در حال انجام است. در این رساله، در راستای بهبود کارایی یادگیری جمعی در دسته بندی داده ها که بر بستر کلان داده ها نیز قابلیت پیاده سازی داشته باشد، ابتدا به مرور ادبیات و شناسایی شکاف های موجود در آن پرداخته شد. شناسایی شکاف ها، زمینه مناسبی جهت مطالعه برروی انواع روشهای ساخت مدل های یادگیری جمعی را فراهم آورد. سپس جهت توسعه مدل یادگیری جمعی پیشنهادی، یک رویکرد توسعهای گام به گام در نظر گرفته شد. نتایج هر گام براساس معیارهای متنوع سنجش و برای توسعه گام بعدی مورد استفاده قرار گرفته است. ایجاد تنوع در دسته بندی های پایه و کاهش ابعاد در اولین گام به عنوان چالش در نظر گرفته شد که برای حل آن یک راهکار لفاف مبتنی بر الگوریتم فراابتکاری چندهدفه جنگل ارائه شد. جهت بهبود فرآیند جستجو در روش لفاف یک الگوریتم فراابتکاری جدید چندهدفه جنگل با در نظر گرفتن مفاهیم آرشیو، انتخاب منطقهای نظریه آشوب و... ارائه شده است، که توانایی رقابت با سایر روشهای مشابه از نظر اهداف کاهش ابعاد و بهبود کارایی دسته بندی، دارای پیچیدگی زمانی کمتری نیز می باشد. در ادامه برای مواجهه داده های با ابعاد بالا، راهکار ترکیبی مبتنی بر فیلتر چندگانه و لفاف چندهدفه ارائه شد. جهت کاهش فضای جستجوی روش لفاف، یک رویکرد فیلترچندگانه جدید با در نظر گرفتن ترکیب روش های تک متغیره و چند متغیره ارائه شده است که با کاهش فضای جستجو امکان انتخاب ویژگی های برجسته و مهم را برای روش لفاف فراهم میآورد. از طرفی روش لفاف چندهدفه علاوه بر حل مسئله انتخاب ویژگی، پارامترهای مدل دسته بندی را بهینه سازی می کند. در سومین گام جهت ساخت مدل یادگیری جمعی، راهکاری نوآورانه ای برای انتخاب اعضای سازنده مدل یادگیری جمعی از میان پاسخ های جبهه پارتو و ترکیب نتایج اعضای سازنده برای ارائه خروجی نهایی ارائه داده شد. در گام نهایی مدل یادگیری جمعی پیشنهادی برای افزایش مقیاس پذیری و توانایی مواجهه با داده های حجیم بر بستر اکوسیستم هدوپ پیاده سازی شد. ارائه مدل یادگیری جمعی مبتنی بر انتخاب ویژگی و کاهش ابعاد بر بستر کلان داده جزء مهمترین نوآوری های این تحقیق می باشد. نتایج آزمایشات، موید مزایای رویکرد پیشنهادی در استفاده از پردازش موازی و همچنین بهبود کیفیت دسته بندی بر اساس دقت و صحت دسته بندی می باشد.