بازشناخت الگو [1] 1-بازشناخت الگو عبارت است از خوشهیابی [2] یا طبقهبندی [3] مشاهدات و اندازهگیریها که توسط طبقهبندی کننده [4] انجام میپذیرد. طبقهبندی کنندهها به طبقهبندی کننده آماری، طبقهبندی کننده بکمک شبکه عصبی و غیره تقسیم میشود. طبقهبندی کننده را میتوان بهینهساز ملاک یا استخراج کننده قاعده تلقی کرد که در دو قالب طبقهبندی کننده مکتب میشیگان و طبقهبندی کننده مکتب سنپطرزبورگ مطرح هستند. در قالب خوشهیابی یا طبقهبندی برای یکسری موجودیت [5] در فضای ویژگی، یک برچسب تعیین میشود که به آن نماینده خوشه اطلاق میگردد. نماینده خوشه میتواند از هر جنسی که برای آن فاصله تعریف شده باشد [6] ، درنظر گرفته شود (از جنس دادهها، مرز(دایروی، بیضوی، محدب پیوسته)، شاخص هندسی(خط یا منحنی) [7] ، تابع چگالی و غیره). 2-معمولا لفظ خوشهیابی با طبقهبندی این تفاوت را دارد که وقتی تعداد خوشهها یا طبقهها از پیش معین است، از لفظ طبقهبندی و وقتی تعداد آن مشخص نیست از لفظ خوشهیابی استفاده میگردد. به بیان دیگر طبقهبندی یک یادگیری باسرپرست و خوشهیابی یک یادگیری بدون سرپرست میباشد. 3-خوشهیابی یا طبقهبندی میتواند بصورت فازی یا ترد [8] انجام شود. بدین معنا که تعلق یک موجودیت به یک خوشه یا طبقه میتواند صفر یا یک و یا اینکه عددی بین صفر و یک باشد. 4- خوشهبندی یا طبقهبندی متناظر با یافتن رابطه شباهت یا دوگان آن عدم شباهت (فاصله) است. خوشهها یا طبقهها به قسمی انتخاب میشوند که عضوهای موجود در یک خوشه، بیشترین شباهت (نزدیکی) بهم و بیشترین تفاوت (فاصله) را از اعضای سایر خوشهها داشته باشند که توسط معیار جداییپذیری [9] سنجش میشود. 5- در فرآیند بازشناخت الگو، استفاده از طبقهبندی کننده، پس از انجام دو گام برای پیشپردازش اطلاعات انجام میشود که انجام مناسب آن در نتیجه نهایی طبقهبندی بسیار اهمیت دارد. گام اول استخراج ویژگی [10]، گام دوم شایستهسازی ویژگی [11] و گام نهایی بکارگیری طبقهبندی کننده [12] به منظور طبقهبندی بردار ویژگیهای منقح شده میباشد. 6-شایستهسازی ویژگی با نرمالیزه کردن اطلاعات (میانگین صفر و واریانس یک، بین صفر و یک یا منفی یک و یک) و کاهش ابعاد اطلاعات با تحلیل اجزاء اصلی [13] (مثلا حذف وابستگی بین اطلاعات بکمک تجزیه مقادیر تکین) قابل انجام است. مثلا مطابق رابطه ذیل، عملیات محدودکردن دامنه با ضرب ماتریس A1 ، عملیات حذف وابستگی خطی با ضرب ماتریس A2 ، عملیات کاهش بعد با حداقل کاهش جداپذیری با ضرب ماتریس A3 انجام میشود و بردار اطلاعات x با شایستهسازی تبدیل به بردار اطلاعات y میگردد و آماده اعمال الگوریتمهای طبقهبندی میشود. شایستهسازی ویژگی  7-ویژگیای بهتر است که جداپذیری بیشتری داشته باشد. میزان جداییپذیری با سنجش فاصله بیرونی و درونی با محاسبه نسبت جداییپذیری فیشر [14] یا ماتریس پراکندگی [15] قابل سنجش است. واریانس معیاری برای فاصله درونی و فاصله نماینده دو خوشه، معیاری از فاصله بیرونی میباشد. نسبت جداییپذیری فیشر  8-کلاسه کنندهها، به کلاسه کنندههای آماری و شبکه عصبی تقسیم میشود. کلاسهکنندههای آماری، به کلاسه کننده بیزی، کلاسه کننده نزدیکترین همسایه، کلاسه کننده k نزدیکترین همسایه، کلاسه کننده حداقل فاصله میانگین [16] ، کلاسه کنندههای خطی و شبکه عصبی به شبکه پرسپترون چندلایه MLP ، شبکه RBF ، شبکههای رقابتی قابل تقسیم است. 9-کلاسهکننده آماری بیزی با تعیین تابع تخمین توزیع تمامی طبقهها انجامپذیر است. تخمین تابع توزیع از روش پارامتریک یا غیرپارامتریک (روش پارزن [17] ، k نزدیکترین همسایه) قابل انجام است. از روشهای پارامتریک فرض تابع توزیع گوسی (برای اطلاعات تکمدولار [18] متقارن)، فرض تابع توزیع نمایی یا پواسن (برای اطلاعات تکمدولار غیرمتقارن)، روش حداکثر شباهت [19] و روش MAP قابل ذکر است[20]. 10-نماینده خوشه میتواند نماینده جرمی [21] (میانگین، میانه،مرکز جرم)، نماینده خطی [22] (ابرخط)، نماینده پوسته [23] (ابرصفحه، ابرکره) باشد. 11-برای تعیین فاصله درونی [24] و بیرونی هر طبقه باید مفهوم فاصله برای فاصله نقطه از نقطه، فاصله نقطه از مجموعه و فاصله مجموعه از مجموعه تعریف گردد. تعاریف ذیل برای تعریف فاصله نقطه از نقطه وجود دارد. فاصله اقلیدسی  تعاریف ذیل برای تعریف فاصله نقطه از مجموعه وجود دارد. 
فاصله مجموعه از مجموعه با محاسبه نماینده دو مجموعه، مینیمم فاصله هر x از نماینده y ها، مینیمم فاصله نماینده x از هر y ، مینیمم فاصله هر x از هر y قابل محاسبه است. 12-فاصله لزوما نباید یک عدد اسکالر باشد. همچنین میتوان فاصله جهتدار [25] تعریف نمود. 13-الگوریتمهای خوشهیابی به سه خانواده مبتنی بر ملاک بهینهسازی [26] (الگوریتم ISODATA ، C-means )، سلسلهمراتبی [27] (با شروع از خوشه بدیهی و حرکت به سمت جواب با جدا کردن و ترکیب کردن) و متوالی [28] تقسیم میشود. شروان عطایی ویرایش اول 7/5/86 مرجعها توجه: در نوشتن این مقاله، از جزوه بازشناخت الگوی دکتر اعرابی، استاد دانشکده برق و کامپیوتر دانشکده فنی دانشگاه تهران استفاده شده است [1] Pattern recognition, S. Theodoridis, K. Koutroumbas, Academic Press,1999. [2] Pattern classification, 2nd Ed, R.O. Duda, P.E. Hart, D.G. Stork, Wiley, 2000. [3] Neural Networks for pattern recognition, C.M. Bishop, ITRC Library, 1996. [4] Fuzzy models for pattern recognition :methods that search for structures in data, C. Bezdek, S.K. Pal, editors,1992.
[1] Pattern recognition [2] clustering [3] classification [4] classifier [5] entity [6] مثلا فاصله یک نقطه از یک شکل، فاصله از نزدیکترین نقطه آن شکل تعریف میشود. [7] در این حالت، خوشهیابی شبیه تقریب تابعی (function approximation) خواهد شد. [8] crisp [9] separability [10] Feature extraction [11] Feature conditioning [12] classifier [13] Principle Component Analysis (PCA) [14] Fisher discriminate ratio [15] Scatter matrix [16] Minimum mean distance classifier [17] parzen [18] unimodular [19] Maximum likelihood [20] Maximum apostriori [21] Mass cluster [22] Linear cluster [23] Shell cluster [24] Intra-set-distance [25] Signed distance [26] Optimization based [27] Hierarchical based [28] Sequential based |