فایل ورد قابل ویرایش
کلاسه بندي با درختهاي تصميمگيري در پايگاهدادهها
کلاسهبندي دادهها يک فرآيند دو مرحلهاي است :
1. در مرحله اول يک مدل ساختهميشود که مجموعهاي از کلاسهاي دادهاي يا مفاهيم را مشخص ميکند . اين مرحله را مرحله يادگيري گوييم که در آن يک الگوريتم کلاسهبندي يک مدل را با تحليل يک مجموعه آموزشي که مجموعهاي از تاپلهاي پايگاه است مي سازد و برچسب کلاسهاي مربوط به اين تاپلها را مشخص ميکند . يک تاپل X با يک بردار صفت X=(x1,x2,…,xn) نمايش داده ميشود . فرض مي شود که هر تاپل به يک کلاس از پيش تعريف شده متعلق است و کلاس با يک صفت که به آن صفت برچسب کلاس ميگوييم مشخص ميشود . مجموعه آموزشي به صورت تصادفي از پايگاه انتخاب مي شود .
2. در مرحله دوم ، يادگيري از طريق يک تابع y=f(X) انجام ميشود که ميتواند برچسب کلاس هر تاپل X از پايگاه را پيش بيني کند . اين تابع به صورت قواعد کلاسهبندي ، درختهاي تصميم گيري يا فرمولهاي رياضي است .آنچه ما در اينجا براي کلاسهبندي بررسي ميکنيم کلاسه بندي با درختان تصميمگيري است .
درختهاي تصميمگيري
بر اساس مجموعه آموزشي يک درخت ايجاد ميکنيم که در اين درخت هر گره داخلي يک آزمون را روي يک صفت نشان ميدهد ، هر شاخه نتيجهاي از تست را نشان ميدهد و هر برگ برچسب يک کلاس را نگهداري ميکند . نمونهاي از درخت تصميم گيري در شکل زير آمده است :
نمونه اي از درخت تصميم گيري
درخت تصميم در شکل بالا مفهوم buys_computer را نشان ميدهد ، اينکه آيا يک مشتري در يک فروشگاه لوازم الکترونيکي علاقمند به خريد کامپيوتر است يا خير ؟ همانطور که در شکل ديده مي شود اين درخت داراي دو برچسب کلاس متمايز در برگهاي خود است که yes و no مي باشند .
نحوه استفاده از درخت تصميم گيري به اين صورت است : اگر تاپلي چون X که برچسب کلاس آن نامشخص است داشته باشيم صفات اين تاپل در درخت مورد آزمون قرار مي گيرند و يک مسير از ريشه به سمت يک برگ که برچسب يک کلاس را دارد ايجاد مي شود .
الگوريتم درختهاي تصميم گيري
در زير شبه کد يک الگوريتم پايه براي درختهاي تصميم گيري را ميبينيد :
مجموعه فایل پاورپوینت داده کاوی
حجم:9044KB | بازدید :2610
علم داده کاوی عبارتست از استخراج اطلاعات ,دانش وکشف الگوهای پنهان از پایگاه داده های بسیار...
حجم:5698KB | بازدید :2769
در این بخش بر روی مدلهای لاجیت وپروبیت تاکید می شود .از آنجایی که این مدلها بسیار بهم مرتبط اند آنها را به عنوان مدلهی رگرسیون ترتیبی بیان می...
حجم:3094KB | بازدید :433
برنامه ریزی استراتژیک یک روش منطقی ودر عین حال ساده برای ایجاد یک ساختار تصمیمگیری مناسب درجهت دستیابی اهداف سازمانی است امروزه سازمانها ناگزیرند که به اندیشه های خود درباره تغییر ,تحول ,نوآفرینی ودگرگونی شکل دهند...
پاور پوینت سیاست وتوسعه کشاورزی
حجم:3053KB | بازدید :424
قسمتی از متن تاریخچه این گستره از علم را می توان تقریبا به دو دوره تقسیم نمود: 1- دوره رشد و نوسازی اقتصادی: این مقطع دهه های1940، 1950 و 1960 را شامل می شود. در این دوره، توسعه را عمدتا بر اساس رشد متوسط تولید سرانه تعریف می کردند. در این زمینه امور زیر مورد بررسی قرار...
حجم:1308KB | بازدید :2874
قسمتی از متن جستجو براي اطلاعات با ارزش در ميان حجم زيادي از داده ,استخراج اتوماتيک مدل از داده,فرآيند استخراج اطلاعات نهفته در حجم زيادي از داده داده کاوي يکي از مراحل KDD است KDD از تکنيکهايي نظير پيش پردازش ، تميز سازي، تبديل، داده کاوي و ... براي استخراج...
دانلود پاورپوینت الگوریتم ژنتیک
حجم:1005KB | بازدید :256
مفاهیم الگوریتم, زمینه بیولوژیکی ,زمینه تاریخی ,نمودار گردشی فرآیند, مکانیسم GA ,وهمچنین حل...
حجم:32KB | بازدید :2803
قسمتی ازمتن lData Mining عبارت است از اقتباس يا استخراج دانش از مجموعه ای از داده ها ، به بيان ديگر ، Data Mining فرايندی است که با استفاده از تکنيکهای هوشمند، دانش را از مجموعه ای از داده ها استخراج می کند. l lData Mining از ساخت مدل های تحليلی ، دسته بندی و پيش بينی اطلاعات و...