تئوری Rough Set در سالهای 1980 توسط Zdzislaw Pawlak توسعه یافت. این دیدگاه برای بیان و بررسی مسائلی است که در آنها عدم قطعیت و ابهام وجود دارد. معمولا ً برای پیدا کردن نا همگونی­ها و ارتباطات در اطلاعات به کار می­رود. مهمترین ویژگی­های این تئوری عبارتند از:


الگوریتم بهینه برای پیدا کردن الگوها در داده ­ها دارد.

پیدا کردن روابطی که توسط روش­های آماری کشف نمی­شوند.

امکان استفاده از اطلاعات کمی و کیفی.

پیدا کردن مجموعه minimal از داده­ ها که برای کلاس بندی مفید است ( مانند کم کردن ابعاد و تعداد اطلاعات ).

ارزیابی اهمیت داده ها.

تولید قوانین تصمیم گیری از روی اطلاعات.



سیستم های اطلاعاتی[1]

برای اجرای مجموعه­ های Rough ، اطلاعاتی که استفاده می­ شود معمولا ً به شکل جدول مسطح نمایش داده می­ شود. ستون­ها نمایش دهنده ویژگی­ها، سطرها نمایش دهنده اشیا و سلولها حاوی مقادیر ویژگی­ ها بر هر شی است. در لغتنامه­ ی مجموعه­ های Rough به این نوع جدول سیستم­ های اطلاعاتی گفته می­شود. شکل زیر نمایش دهنده یک جدول با این مشخصات است:




در شکل فوق ، شش شی به همراه سه ویژگی وجود دارد. E نشان دهنده تجربه کارمندان فروش، Q کیفیت کالا و L وجود ایستگاه قطار در نزدیکی فروشگاه را مشخص می­کند. همان طور که مشخص است فروشگاه­ های 2 و 3 مقادیری مشابه دارند و با استفاده از این مشخصات از هم قابل تفکیک نیستند[2]. رابطه زیر را رابطه­ ی تفکیک ناپذیر می­گویند:


اگر xوy دو شی باشند و برای هر ویژگی که در مجموعه ­ی B باشد مقدار آن ویژگی در دو شی یکسان باشد آنگاه را رابطه تفکیک ناپذیرB- می ­نامند.
در خیلی از مسائل کلاس بندی­، خروجی از قبل مشخص است. برچسب کلاس را ویژگی تصمیم گیری[3] می ­نامند. سیستم اطلاعاتی که حاوی ویژگی تصمیم گیری باشد، سیستم تصمیم گیری[4] نام دارد.




در شکل فوق ستون pf (سود دهی ) ویژگی تصمیم گیری است. در این جدول فروشگاه­ های 2 و 3 ویژگی­ های یکسانی دارند اما از نظر سوددهی وضعیت مشابهی ندارند. به عبارت دیگر، ویژگی تصمیم گیری آنها با هم تفاوت دارد.

در شکل فوق مجموعه توانی ویژگی­ ها عبارتست از {E} , {Q} , {L} , {E,Q} , {E,L} , {Q,L} , {E,Q,L} . اگر {E,Q} را فرض کنیم، رابطه تفکیک ناپذیری عبارتست از :



مجموعه {2,3} در رابطه فوق توسط E و Q تفکیک ناپذیر هستند و به یک کلاس هم ارزی تعلق دارند. روابط دیگر و کلاس های هم ارزی آنها به این شرح زیر است:



فرض کنید یک سیستم اطلاعاتی که U مجموعه­ ی اشیا و A ویژگی­ ها است وجود داشته باشد و و . دو مجموعه به شرح زیر تعریف می­شود :



که به آنها B-پایین[5] و B-بالا[6] تخمینی از X گفته می­شود.

مجموعه­ های و احتمالا ً دارای اشیائی متعلق به X با توجه به تعریف B هستند. به   B-محدوده مرزی [7]روی X گفته می­شود و حاوی اشیائی است که قطعا ً در X نیستند. یک مجموعه  Rough است که با توجه به B، مجموعه مرزی آن تهی نباشد.

برای مثال اگر یعنی X={1,3,6}  (فروشگاه های 1 و 3 و 6 سوددهی دارند). اگر B={E,Q,L} فرض شود آنگاه :



طبق تعریف مجموعه­ های و برابر هستند با :



همان طور که مشخص است مجوعه مرزی تهی نیست. فروشگاه­ های 1و6 سود ده هستند، در فروشگاه های 1و2و3و6 فروشگاه هایی هستند که احتمالا ً سود دهی دارند. فروشگاه ­های 2 و 3 را نمی­ توان با B تعیین تکلیف کرد.   هم فروشگاه­ هایی هستند که قطعا ً سود دهی ندارند. میزان دقت مجموعه Rough را می­توان با عبارت زیر تعیین کرد :




تابع تعلق Rough

درجه ی تعلق x به X را می توان با تابع تعلق rough بیان کرد. این تابع تعلق درجه هم پوشانی مجموعه X و کلاس هم ارزی را تعیین می­کند.



با توجه به این تعریف مجموعه­ های بالا و پایین تخمین دارای توابع تعلقی مانند زیر می­شوند :





وابستگی ویژگی ها[9]

در بررسی داده­ ها پیدا کردن رابطه­ ی بین ویژگی­ های شرطی و ویژگی تصمیم گیری اهمیت دارد. با استفاده از این وابستگی بین ویژگی ها می توان آنهایی که اهمیت ندارند را حذف کرد. اگر Td مجموعه ویژگی­ های تصمیم گیری باشد و Tc مجموعه ی ویژگی­ های شرطی، وابستگی بین آنها به این شکل بیان می­شود Tc=>Td و معنی این است که تمام مقادیر تصمیم گیری از مقادیر شرطی بدست می­ آیند. البته حالت partial هم می­ تواند داشته باشد. تعریف رسمی برای این خاصیت عبارتست از :

اگر C و D زیر مجموعه های A باشند به طوری که اشتراک C و D تهی و اجتماع آنها A باشد، می­گوییم D وابسته است به C با درجه k (0<k<1) و به این شکل نمایش داده می­شود اگر


اگر k برابر یک باشد یعنی D کاملا ً به C وابسته است. در مثال قبلی ویژگی تصمیم گیری (pf) با درجه به مجموعه ویژگی­های {E,Q,L} وابسته است زیرا:

 


کاربرد

با استفاده از تئوری مجموعه ­های Rough می­توان از ابعاد ویژگی ­ها کم و آنهایی که در تصمیم گیری برای رسیدن به یک کلاس خاص استفاده ندارند را بی اهمیت کرد. برای مثال در شکل زیر خودروی توصیه شده با توجه قیمت، قدرت موتور و سن خریدار آمده است.



بعد از پیدا کردن روابط میان ویژگی­ها و حذف موارد بی ­ربط به ستون آخر، شکل زیر ساخته می­شود. همانطور که در شکل زیر مشخص است جدول بسیار خلاصه­ تر شده و سریع تر می­توان کلاس بندی را انجام داد:



از این روش در ساختن قانون­های سازگاری، ساختن نمونه­ های انتزاعی و کلی­ تر(generalized) شده و آسانی در فراخوانی و بررسی صحت عملکرد بانک نمونه ها می­ توان استفاده کرد. به کمترین مجموعه­ ای که عمل جداسازی و کلاس بندی را بتواند انجام دهد reduct گفته می­شود. در ترکیب روش فازی و Rough، مقادیر ویژگی­ ها به جای مقادیر اصلی به شکل فازی ذخیره می­ شوند (low/medium/high) ، سپس با استفاده از تئوری مجموعه­ های Rough قوانین جدا کننده ساخته می­ شود. برای هر ویژگی تابع تعلق مناسبی برای low/medium و high ایجاد می­ شود.

این مطالب از کتاب Foundation of Soft CBR آورده شده است. در آینده روش محاسبه و ساخت جدول آخر را شرح خواهم داد.

[1] Information Systems

[2] Indiscernible

[3] Decision Attribute

[4] Decision System

[5] B-lower approximation

[6] B-upper approximation

[7] B – Boundary Region

[8] Rough Membership

[9] Dependency of Attributes
Gravatarhamed
شنبه ساعت 13:47 , 27/3/1391
با تشکر از شما دوست عزیزدر صورت امکان اگر اطلاعات دیگری نیز در رابطه با rough set دارید، بفرمایید
Gravatarbaran
شنبه ساعت 11:00 , 10/4/1391
سلام مطالب خوبی ارائه کردیدمیشه بیشتر راجع به تئوری Rough Set مطلب بنویسید و اینکه اگر منابعی که میتوان راجع به این موضوع به آنها مراجعه کرد را ذکر کنید ممنون میشم.تشکر
Gravatarabbas
يکشنبه ساعت 01:28 , 15/5/1391
با سلام و احترامممنون و متشکر از مطلب بسیار خوبتوناگه باز مطلببهتری دارید و بفرمایید ممنون میشم
Gravatariman
يکشنبه ساعت 19:10 , 15/5/1391
مطلب خوبی بوده است اگر میشود کتب مربوطه را برام بفرستید.یا اگر مطلب دیگری رادر مورد مجموعه راف داریدبسایر سپاسگذارم.باتشکر ایمان
Gravatarfarshid
چهارشنبه ساعت 12:13 , 20/10/1391
سلام دستتون درد نکنه خوبه.منم میخوام تو پایان نامم از این تئوری استفاده کنم.ممنون میشم اگر مقالاتی در زمینه برام ارسال کنبد
Gravatarفریناز
چهارشنبه ساعت 01:10 , 21/1/1392
مرسی خیلی عالی بود6734
Gravatarمحمد
چهارشنبه ساعت 20:47 , 30/7/1393
با سلام/ در زمینه تئوری راف و تئوری خاکستری اخیرا کتاب خوبی با نام مجموعه های راف و مجموعه های خاکستری (مبانی، کاربرد، نرم افزار) به همراه سی دی نرم افزار نوششته دکتر تورج کریمی انتشارات مهربان روانه بازار شده که بسیار کاربردی و عالی مباحث پیچیده این دو تئوری و حتی تلفیق این دو را بیان کرده است.
نام :   
ايميل :      اين سايت از سيستم گراواتر استفاده می کند ، اگر در گراواتر دارای کد کاربری هستيد می توانيد از آن آدرس ايميل استفاده کنيد.  
وب سايت :   
ديدگاه :   
عدد زير را وارد کنيد :
  


  پيام شما بعد از بازبينی افزوده خواهد شد.