حسابگری نرم 1-دادهکاوی بوسیله حسابگری نرم قرن حاضر، قرن فنآوری اطلاعات و داده کاوی[1] است. انقلاب دیجیتالی، ثبت و ذخیرهی اطلاعات را بصورت عددی بسیار آسان نموده است. با توسعهی سختافزاری و نرمافزاری و به خدمتگیری آن در امور زندگی، حجم عظیمی(از نظر تعداد و بعد) از اطلاعات غیرمتجانس(مخلوطی از اطلاعات موضوعی، نمادین، عددی، متنی، تصویری) ثبت و ذخیره میشود و دیگر با این حجم از اطلاعات غیرمتجانس، استفاده از روشهای آماری کلاسیک جهت تحلیل کفایت نمیکند. رویکرد شناسایی الگو [2] و یادگیری ماشین [3] اصولی هستند که برای تحلیل اطلاعات نامتجانس و حجیم بکار میرود و کاوش اطلاعات نام دارد. کاوش اطلاعات، فرآیندی برای شناسایی الگوهای قابل قبول، جدید، مفید و قابل فهم از اطلاعات است. بهمنظور کارآیی، استحکام و انعطافپذیری مورد نیاز در کاوش اطلاعات حجیم و نامتجانس، استفاده از ابزار محاسبات نرم [4] مورد نیاز است. هدف محاسبات نرم، بهرهبرداری از مقداری قابل قبول از عدمقطعیت، ابهام، استدلال تقریبی و حقیقت نسبی جهت دستیابی به قابلیت مهارکردن [5] ، استحکام [6]، هزینهی کم حل مساله و تشابه نزدیک با الگوی تصمیمگیری بشری میباشد. ادعای اصلی محاسبات نرم، پذیرش حدی قابل قبول از نادقیقی با به خدمت گرفتن روشهای محاسباتی است که به حل قابل قبول و ارزانتر مساله منجر میشود. محاسبات نرم، پایهای برای هو ش مصنوعی است و ساختار اصلی آن را منطق فازی [7]، محاسبات نرونی [8]، الگوریتم ژنتیک [9] و مجموعههای ناهموار [10] تشکیل میدهد که اجزای این ساختار مکمل همدیگرند و نه رقیب یکدیگر. منطق فازی الگوریتمهایی برای مدلسازی ابهام و عدمقطعیت فراچنگ میآورد، محاسبات نرونی وسیلهای برای یادگیری و برازش منحنی در اختیار قرار میدهد، الگوریتم ژنتیک الگوریتمهایی برای جستجو و بهینهسازی ارائه میدهد و مجموعههای ناهموار چارچوبی برای منظور نمودن عدمقطعیت فراهم میآورد. 2-فرآیند کشف رابطه حاکم بر اطلاعات جستجوی الگوی حاکم بر اطلاعات با فشردهسازی اطلاعات توسط کشف رابطه شباهت یا رابطه زیرمجموعگی حاکم بر اطلاعات آغاز میشود. رابطه شباهت رابطهای متقارن و رابطه زیرمجموعگی، پادمتقارن میباشد. یافتن رابطه شباهت یا زیرمجموعگی حاکم بر اطلاعات، متناظر خوشهبندی اطلاعات میباشد. در ادامه رابطه ترتیبی و نظم حاکم بر این خوشهها جستجو میشود. از میان روابط موجود بین زوجهای مرتب، رابطهای که دارای خصوصیات بازتابی، تقارنی و تراگذری (انتقالی) میباشد ، در حالت کلی رابطه شباهت اطلاق میشود. این رابطه در حوزه نظریه مجموعههای کلاسیک، رابطهی همارزی خوانده میشود. همانطور که میدانیم، هر رابطهی همارزی بیانگر یک افراز میباشد و هر افراز یک رابطهی همارزی تعریف میکند. مثلا رابطهی همکلاسی بودن در مجموعهی مرجع شاگردان مدرسه، یک رابطهی همارزی است و این رابطه، مدرسه را به چندین خوشه تقسیم میکند. بنابراین از نقطه نظر ریاضی، با یافتن یک رابطهی همارزی، خوشهیابی انجام شده و فشردهسازی اطلاعات انجام گردیده است. دو نمونهی همارز در یک خوشه قرار میگیرند و دو نمونهی غیرهمارز در دو خوشهی جدا قرار میگیرند. تعابیر متفاوتی از رابطه شباهت در حوزهی نظریهی مجموعههای فازی ارائه شده است که از آن میان میتوان به رابطهی شباهت [11] (پیشنهاد زاده)، رابطهی همانندی [12] (پیشنهاد rusppini ) و رابطهی تمیزناپذیری [13] (پیشنهاد mantaras و valverde ) اشاره نمود. با تعریف رابطهی شباهت میتوان به طور مشابه تعریفی برای فاصله (عدم شباهت، متریک دروغین) ارائه نمود که شباهت با قانون دمورگان به فاصله مربوط میشود. بنابراین از نقطه نظر ریاضی، یافتن یک رابطهی همارزی (در حوزهی نظریهی مجموعههای کلاسیک) یا یک رابطهی شباهت / رابطهی همانندی / رابطهی تمییزناپذیری (در حوزهی نظریهی مجموعههای فازی) در بین اطلاعات، معادل شناسایی الگوهای مشابه موجود در اطلاعات میباشد. از سوی دیگر، رابطه زیرمجموعگی به رابطهای اطلاق میشود که از نظر ریاضی دارای خواص انعکاسی، پاد تقارنی و تراگذری(انتقالی) میباشد. توسعه مفهوم رابطه زیرمجموعگی به نظریه مجموعههای فازی با توسعهی مفاهیم زیرمجموعگی و عدم زیرمجموعگی قابل انجام است که پیشنهادهای مختلفی برای آن وجود دارد. کشف رابطه زیرمجموعگی حاکم بر اطلاعات نیز متناظر خوشهبندی و فشردهسازی اطلاعات میباشد. با کشف این رابطه عناصر پایهای اطلاعات مشخص میگردد و عمل جداسازی منبع [14] انجام میپذیرد. پس خوشهبندی اطلاعات، نوبت به کشف رابطه ترتیبی و نظم حاکم بر این خوشهها میرسد. رابطهی اگر...آنگاه را میتوان یکی از این نوع روابط دانست که از آن در حوزهی نظریه مجموعههای فازی دو تعبیر متفاوت شده است. برخی آنرا از نوع تداعی تلقی میکنند و در نتیجه آنرا رابطهای متقارن تصور میکنند و برخی دیگر آنرا رابطهای ایجابی میدانند و در نتیجه آنرا مطابق منطق ارسطویی، رابطهای پادتقارنی میانگارند. 3-جستجوی قانون توسط استقراء یادگیری، توانایی استنباط و تطبیق جزو عوامل بقای بشر است. بشر با تامل در مشاهدات به کشف قوانین طبیعی نایل میآید و مدلهای ساده شدهای از روابط پیچیدهی طبیعی میسازد و از آن در پیشبینی رفتار طبیعت مدد میجوید. هر چه سادهسازی [15] بیشتر باشد دقت اطلاعات کاهش مییابد. در بازنمایی ریاضی، سیستم مطابق یک قانون طبیعی ساده شدهی مشخص مدلسازی میگردد (قانون نیوتن، قانون ماکسول). این مهم باعث میشود که مدل تنها در یک حالت خاص، مقیاس معلوم و حوزهی کاربرد مشخص اعتبار داشته باشد و عدول از آنها، مدل را غیرقابل استفاده میکند. حال آنکه میتوان به کمک تئوری یادگیری فرضیات کمتری در ساخت مدل بکار برد و حتی قوانین ساده شده را در یک حوزهی وسیعتری از مشاهدات ممیزی نمود. مدلهای ریاضی از نظر تئوری غنی و از نظر تطبیق با مشاهدات فقیرند حال آنکه میتوان به کمک تئوری یادگیری مدلهایی ارائه داد که از نظر تطبیق با مشاهدات غنی و از نظر تئوری ففیرترند. در سالهای اخیر رشد انفجارآمیزی در روشهای یادگیری از اطلاعات مشاهده میشود. در این راستا یک سوال کلی مطرح میشود که چگونه میتوان یک اصل یا قانون کلی را از روی مشاهدات نتیجهگیری کرد؟ این فرآیند، استقرا [16] خوانده میشود. رویکردهای متفاوتی وجود دارد که چارچوبی جهت استقرا از روی مشاهدات محدود فراهم میآورد. از این میان میتوان به [17] RI و [18] SRM و [19] BI و [20] MDL و [21] ESR اشاره کرد [1] که هر یک چارچوبی جهت استقراء از روی مشاهدات محدود فراهم میآورد. در ذیل هر یک از این چارچوبها روشهای یادگیری متفاوتی ارایه شده است که بر اساس هر یک از این اصلهای استقرایی، یک مسالهی بهینهسازی (با تابع هدف و محدودیتهای مشخص) تعیین میگردد و حل مساله به حل این بهینهسازی که در حالت کلی غیرخطی میباشد، منجر میگردد. با شناسایی روابط ناشناخته بین عناصر و اجزا، میتوان از آن در پیشبینی رفتار نیز استفاده نمود. استفاده از قوانین کلی در پیشبینی را اصطلاحا قیاس [22] گویند. راه میانبر دیگری برای پیشبینی رفتار بدون میانجیگری استقرا وجود دارد که به آن استدلال تشبیهی [23] گویند. در این روش، مستقیما از روی مشاهدات رفتار پیشبینی میشود. در فرآیند یادگیری یا استقرا باید ویژگیهای مهم و قابل اعتنای اطلاعات را استخراج کرد و اطلاعات اضافی و زاید را حذف نمود. با توجه به نوع اطلاعات، ویژگیهای متفاوتی مورد توجه قرار میگیرد که از آن میان میتوان به فرکانس [24]، لنگرهای تغییرناپذیر [25] (مثل میانگین، واریانس وغیره)، آنتروپی [26] ، بعد فرکتال [27]، تحلیل cepstrum ، تبدیل هیلبرت و غیره اشاره کرد [2]. ویژگی فرکانسی برای دادههای پایا [28] با تبدیل فوریه و برای دادههای غیرپایا با تبدیل گابور [29] یا تبدیل فوریهی کوتاه زمانی [30] و یا تبدیلهای چند مقیاسی یا تبدیل موجک [31] استفاده کرد. همچنین میتوان ضرایب مدل AR ، طیف توان و غیره را به عنوان ویژگی اطلاعات مورد استفاده قرار داد [3]. فرکانس آنی [32] و یا ساخت سیگنال تحلیلی [33] برای ساخت تابع انرژی نیز نوع دیگری از ویژگی اطلاعاتی میباشند که به کمک تبدیل هیلبرت قابل محاسبه است. 4-معیار جستجوی رابطه یکی از راههای ادراک مفاهیم و رابطهی بین آنها برای حل مسائل، راه عقلانی میباشد. ادراک عقلانی مصطلح، مجموعهای از عقل(با تعبیر تجرید مفاهیم، کشف رابطه و موتور جستجو و استن باط ) و بیان آن با زبان(قالبهای تصور(اسم، خوشه(رابطهی همارزی)) و تصدیق(فعل، مدل گرافی یا اگر .. آنگاه (رابطهی ترتیبی)) میباشد. ادراک عقلانی انسان با یافتن رابطهی همارزی، زیرمجموعگی و ترتیبی حاکم بر مشاهدات سنسوری، و در قالب زبان انجام میپذیرد. نکتهی پایهای در یافتن این روابط، معیار جستجوی رابطه میباشد که از فرهنگی به فرهنگ دیگر متفاوت است و شاید محققین از آن تعبیر به فرازبان میکنند. اینکه خوشهیابی(یافتن رابطهی همارزی یا زیرمجموعگی) با چه معیاری انجام پذیرد و مدل گرافی یا اگر .. آنگاهی (رابطهی ترتیبی) با عنایت به چه معیاری کاوش گردد. هر حوزهی تخصصی برای خود معیار مشخصی دارد که منجر به تفسیر خاص خود از طبیعت و مشاهدات سنسوری میگردد. به نظر میرسد باید در حوزهی تجربه به کاویدن معیارهای علمی قوانین فیزیکی دست یازید و سعی نمود با عنایت به این معیارها و با توجه به عصر اطلاعات و انقلاب دیجیتال مسائل را بصورت اطلاعات محور [34] حل کرد و تجارب و مشاهدات را بازخوانی نمود. 5-قاعدههای یادگیری قواعد یادگیری در حوزههای متفاوتی فرمولبندی شده است. گونههای متفاوت این روشها را در تئوری یادگیری آماری، تئوری اطلاعات، شبکههای عصبی مصنوعی، سیستمهای فازی و الگوریتمهای ملهم از طبیعت میتوان مشاهده کرد. روح حاکم بر این تئوریها مشابه است، لکن بعضا رویکرد متفاوتی دارند. به عنوان نمونه میتوان رویکرد شبکهی عصبی را که تلاشی برای شبیهسازی رفتار انسان در یادگیری از روی مشاهدات میباشد، رویکردی شییگرا قلمداد نمود و رویکرد آماری را رویکردی ساختارگرا دانست. از قواعد یادگیری متنوعی که در حوزههای مختلف ارائه شده است، میتوان به قواعد ذیل اشاره کرد. · یادگیری مبتنی بر تصحیح خطا (قاعده دلتا، قاعده ویدرو-هاف [35] ) · یادگیری مبتنی بر حافظه · یادگیری هب [36] · یادگیری رقابتی · یادگیری بولتزمن [37] · یادگیری تکاملی · یادگیری ژنتیک · یادگیری ملهم از آب دادن فولاد · یادگیری ملهم از کولونی مورچه · یادگیری ملهم از سیستم ایمنی بدن انسان در یک تقسیمبندی دیگر میتوان یادگیری را به یادگیری بدون سرپرست [38] و یا یادگیری با سرپرست [39] (با ناظر و یا با نقاد) تقسیمبندی کرد. یادگیری بدون سرپرست برای حل مسایل کاهش بعد اطلاعات [40] ، خوشهیابی [41]، فشردهسازی اطلاعات [42]، استخراج ویژگی [43]، بازشناخت الگو [44]، جداسازی کورکورانه منابع [45] و غیره مورد استفاده قرار میگیرد. برخی اوقات این روشها به عنوان فاز پیشپردازش اطلاعات برای روشهای باسرپرست مورد استفاده قرار میگیرد. از الگوریتمهای مورد استفاده در حوزهی تئوری آمار میتوان به [46] LVQ و [47] FA و [48] PCA و [49] ICA و [50] SVP و غیره اشاره کرد. از الگوریتمهای مورد استفاده در حوزهی تئوری شبکهی عصبی میتوان به [51] SOM و [52] ART و [53] KCM و غیره اشاره کرد. هدف روشهای یادگیری بیسرپرست را میتوان خوشهبندی اطلاعات تلقی نمود حال آنکه عموما در روشهای باسرپرست کشف رابطه هدف اصلی میباشد. یادگیری باسرپرست با توجه به اینکه پاسخ مطلوب شبکه وجود دارد و یا اینکه تنها ملاکی برای ارزیابی پاسخ وجود دارد به یادگیری با ناظر و یادگیری با نقاد [54] تقسیمبندی میشود. در یادگیری با ناظر، یادگیری تصحیحی است و در یادگیری با نقاد، یادگیری تقویتی میباشد. یادگیری با سرپرست، برای حل مسایل برازش [55]، طبقهبندی [56] و غیره مورد استفاده قرار میگیرد. 6-چگونگی ترکیب اطلاعات[57] در فرآیند دادهکاوی و یا هر فرآیند تصمیمگیری، چگونگی ترکیب اطلاعات یکی از مسائل کلیدی میباشد. ترکیب اطلاعات توسط سه عملگر "و"، "یا" و "تجمیع (همجوشی)" انجام میگیرد. که با عنایت به نظریه مجموعههای فازی بینهایت عملگر "و"، "یا" و "تجمیع" قابل تعریف است که هر یک در یک بازه مشخص قرار میگیرد. حد بالای عملگرهای از جنس "و"، عملگر مینیمم و حد پایین آن ضرب قوی [58] میباشد. حد بالای عملگر "یا" جمع قوی [59] و حد پایین آن عملگر ماکزیمم میباشد. هر عملگری بین عملگر مینیمم و عملگر ماکزیمم، عملگر تجمیع [60] (همجوشی، میانگینگیری) میباشد. در فرآیند تصمیمگیری و تحلیل اطلاعات به کرات از این عملگرها جهت ترکیب اطلاعات مشاهدات استفاده میگردد. مرجع [1] Learning from data, Cherkassky,V., Mulier, F., John Wiley and sons,1998. [2] Evangelia Micheli-Tzanakou, (1999), “Supervised and Unsupervised Pattern Recognition, feature extraction and computational intelligence”, Industrial electronics series. [3] Ypma, Alexander, (2001), “Learning methods for machine vibration analysis and health monitoring”, Ph.D thesis, Technische Universiteit Delft, Hungary. [4] Data Mining, Practical Machine Learning Tools and Techniques, I.H. Witten, E. Frank, 2nd ed., elsevier, 2005. [5] Weka : Waikato Environment for Knowledge Analysis (machine learning software), University of Waikato, New Zealand.
[1] Data Mining [2] pattern recognition [3] machine learning [4] soft computing [5] tractability [6] robustness [7] fuzzy logic [8] neuro computing [9] genetic algorithm [10] rough sets [11] similarity measure [12] likeness relation [13] indistinguishability relation [14] Source seperation [15] generalization [16] induction [17] Regularization Induction [18] Structural Risk Minimization [19] Baysian Inference [20] Minimum Description Length [21] Early Stopping Rules [22] deduction [23] Analogy or transduction [24] frequency [25] invariant moments [26] Entropy [27] fractal dimension [28] stationary [29] Gabor Transform [30] Short Time Fourier Transform [31] wavelet transform [32] instantaneous frequency [33] analytical [34] Data Driven [35] Widrow-Hoff rule [36] Hebian learning [37] Boltzman learning [38] unsupervised [39] supervised [40] dimensionality reduction [41] clustering [42] data compression [43] feature extraction [44] pattern recognition [45] blind source separation [46] Learning Vector Quantization [47] Factor Analysis [48] Principal Component Analysis [49] I ndependent Component Analysis [50] Support Vector Paradigm [51] Self Organizing Map [52] Adaptive Resonance Theory [53] K-Centers Method [54] Learning with critics [55] regression [56] classification [57] Data fusion [58] Drastic product [59] Drastic sum [60] aggregation |