دفاعیه آقای هیوا صوفی کریمی
| تاریخ ارسال: 1400/6/24 |
چکیده
هدف این پژوهش بررسی چالشهای موجود در زمینه شناسایی شیء و ارائه یک مدل مقاوم و تغییرناپذیر در برابر این چالشها میباشد. شناسایی اشیاء با چالشهایی نظیر تغییرات مقیاس، روشنایی، چرخش و بار محاسباتی و ... مواجه میباشد که وظیفه شناسایی را برای ماشین بسیار دشوار میکند. درحالیکه بینایی انسان در برابر تغییرات محیطی از جمله تغییرات در مقیاس، روشنایی، موقعیت، و درهمریختگی محیط بسیار مقاوم است. بهگونهای که الگوریتمهای بینایی ماشین فاصله زیادی با بینایی انسان دارند. از اینرو در این تحقیق سعی شده است با الهام از بینایی انسان و مدل کردن قشر بینایی، هم از لحاظ ساختاری و هم از لحاظ عملکردی، یک مدل مقاوم شناسایی شیء در بینایی ماشین ارائه شود. در این رساله علاوه بر مقاوم بودن در برابر تغییرات، به مسئله بار محاسباتی که یکی از چالشهای موجود در پیادهسازی میباشند نیز توجه ویژه شده است. در این راستا یک مدل به نام RIMAX ارائه شد که دارای شش لایه اصلی میباشد. در این مدل قشر اولیه در دو لایهS۱,C۱ و قشر ثانویه در لایه FE و ناحیه V۴ در سه لایه S۲, C۲, FR مدل شده است. لایهها در یک ساختار سلسله مراتبی همانند قشر بینایی قرار دارند و هر کدام بهنوبه خود قسمتی از کار مقاومسازی را انجام میدهد. یافتههای تحقیق نشان میدهد که لایههای اول و دوم نقش بسزایی در مقاومسازی نسبت به روشنایی و تغییرات جزئی محلی دارند. همچنین لایه FE که معادل قشر ثانویه مغز میباشد تأثیر بسزایی در افزایش دقت، تکرارپذیری و بالا بردن قابلیت اطمینان مدل دارد. این لایه که وظیفه آن استخراج ویژگیهای غیرتصادفی تصویر است، کارایی مدل را مخصوصاً هنگامیکه تعداد نمونههای آموزشی کم باشد و یا زمانی که تعداد ویژگیهای کمکی در اختیار داشته باشیم بهطور میانگین ۲۰% افزایش می دهد. نتایج نشان میدهند که RIMAX در برابر تغییرات مقیاس در بازه ۶/۰ تا ۲ برابری، بالای ۸۰% باقیمانده است و همچنین در برابر تغییرات زاویه در بدترین حالت دقت مدل نهایتاً ۱۵% درصد افت کرده است. بهبود حاصله در زمینه سرعت بسیار چشم گیر بوده و می توان گفت که سرعت RIMAX تقریباً یازده برابر HMAX و نسبت به AlexNet بدون در نظر گرفتن فاز آموزش تقریباً چهار برابر بوده است.
دفعات مشاهده: 1081 بار |
دفعات چاپ: 200 بار |
دفعات ارسال به دیگران: 0 بار |
0 نظر