فایل ورد قابل ویرایش
چکیده:
سالهای اخیر نیاز به یک فرایند خودکار برای کشف الگوهای جالب و پنهان در پایگاه داده های واقعی و دستکاری حجم زیادی از داده ها بوجود آمده است. این فرایند داده کاوی با الگوریتمهای بسیاری برای عملیات موردنظر همراه است و این الگوریتم ها باید قابلیت مقیاس پذیری بر روی مجموعه داده های بزرگ جهت اجرای کارا را داشته باشند. از اینرو طراحان پایگاه داده ها تصمیم به ارائه روشهایی برای یکپارچه سازی عملیات داده کاوی در پایگاه داده شدند.
1. مقدمه:
سالهای اخیر نشان داده است که تحلیل داده تنها با استفاده از ابزارهای OLAP مشکل شده است. تکنیک های داده کاوی خصوصا در کاربردشان در پایگاه داده های واقعی زیاد مطالعه شده است. این تکنیک ها اغلب به صورت تکراری کل مجموعه را پویش میکند.همچنین وعده سیستمهای پشتیبانی تصمیم، بهره برداری از داده های تجاری برای بدست آوردن سود بیشتر در رقابت با دیگر سیستمها می باشد.
داده کاوی
تکنیکهای داده کاوی براساس آمار و یادگیری ماشین توانایی تحلیل داده را بطور قابل توجهی بالا میبرد. با وجود تاثیر بالقوه داده کاوی در کمک به تحلیل داده، تلاش برای یکپارچه سازی این تکنولوژی با سیستمهای پایگاه داده قدیمی صورت گرفته است، به این علت است که تحلیل داده نیاز به یکی شدن در مخزن بابت جامعیت و مدیریت داده دارد. از نقطه نظر دیگر، داده کاوی یک فعالیت یکباره ای نیست بلکه یک فرایند تکراری و محاوره ای می باشد. در طول فرایند معمولا عملیات داده ماوی متفاوتی اجرا میشوند، نتایج آنها ترکیب و احتمالا به عنوان ورودی برای عملیات دیگر داده کاوی استفاده میشوند.
مراحل اصلی داده کاوی
داده کاوی را " کشف دانش در داده ها " نیز می نامند. کشف دانش داده ها دارای مراحل مختلفی می باشد که در اینجا به صورت خلاصه آنها را بیان می کنیم:
· استخراج اطلاعات از چندین منبع داده ( پایگاه داده)
· یکپارچه سازی اطلاعات و حذف داده های زاید.
· قرار دادن اطلاعات اصلاح شده در انبار داده ها.
· انجام عملیات داده کاوی توسط نرم افزار های مخصوص.
· نمایش نتایج به صورت قابل فهم مانند گزارش و گراف.
فایل ورد قابل ویرایش
مجموعه فایل پاورپوینت داده کاوی
حجم:9044KB | بازدید :2610
علم داده کاوی عبارتست از استخراج اطلاعات ,دانش وکشف الگوهای پنهان از پایگاه داده های بسیار...
حجم:5698KB | بازدید :2773
در این بخش بر روی مدلهای لاجیت وپروبیت تاکید می شود .از آنجایی که این مدلها بسیار بهم مرتبط اند آنها را به عنوان مدلهی رگرسیون ترتیبی بیان می...
حجم:3094KB | بازدید :433
برنامه ریزی استراتژیک یک روش منطقی ودر عین حال ساده برای ایجاد یک ساختار تصمیمگیری مناسب درجهت دستیابی اهداف سازمانی است امروزه سازمانها ناگزیرند که به اندیشه های خود درباره تغییر ,تحول ,نوآفرینی ودگرگونی شکل دهند...
پاور پوینت سیاست وتوسعه کشاورزی
حجم:3053KB | بازدید :424
قسمتی از متن تاریخچه این گستره از علم را می توان تقریبا به دو دوره تقسیم نمود: 1- دوره رشد و نوسازی اقتصادی: این مقطع دهه های1940، 1950 و 1960 را شامل می شود. در این دوره، توسعه را عمدتا بر اساس رشد متوسط تولید سرانه تعریف می کردند. در این زمینه امور زیر مورد بررسی قرار...
حجم:1308KB | بازدید :2874
قسمتی از متن جستجو براي اطلاعات با ارزش در ميان حجم زيادي از داده ,استخراج اتوماتيک مدل از داده,فرآيند استخراج اطلاعات نهفته در حجم زيادي از داده داده کاوي يکي از مراحل KDD است KDD از تکنيکهايي نظير پيش پردازش ، تميز سازي، تبديل، داده کاوي و ... براي استخراج...
دانلود پاورپوینت الگوریتم ژنتیک
حجم:1005KB | بازدید :256
مفاهیم الگوریتم, زمینه بیولوژیکی ,زمینه تاریخی ,نمودار گردشی فرآیند, مکانیسم GA ,وهمچنین حل...
حجم:32KB | بازدید :2804
قسمتی ازمتن lData Mining عبارت است از اقتباس يا استخراج دانش از مجموعه ای از داده ها ، به بيان ديگر ، Data Mining فرايندی است که با استفاده از تکنيکهای هوشمند، دانش را از مجموعه ای از داده ها استخراج می کند. l lData Mining از ساخت مدل های تحليلی ، دسته بندی و پيش بينی اطلاعات و...