معرفی دادهکاوی و دلایل پیدایش آن
تعاریف داده کاوی
جایگاه دادهکاوی در علوم کامپیوتر
۱٫ داده کاوی توصیفی یا توصیف کننده
۲٫ داده کاوی پیشگویانه
۱٫ بیان مسئله و فرموله کردن فرضیه
۲٫ انتخاب و جمع آوری داده ها
۳٫ تبدیل و پیش پردازش داده ها
۴٫ برآورد مدل یا کاوش در داده ها
۵٫ تفسیر نتیجه یا تفسیر مدل و رسیدن به نتایج
۱٫ مدل استاندارد داده ها
۲٫ دو وظیفه اصلی در آماده سازی داده ها
۱٫ نرمال سازی
۱-۱ مقیاس دهی اعشاری
۲-۱ نرمال سازی حداقل–حداکثر
۳-۱ نرمال سازی انحراف معیار
۲٫ یکنواخت سازی داده ها
۳٫ تفاضل ها و نسبت ها
۱٫ روش های آماری ۲٫ تشخیص داده های نامنطیق برمبنای فاصله ۳٫ روش ها و تکنیک های برمبنای انحراف
۲-۱ کاهش زمان محاسبه.
۲-۲ افزایش یادگیری در دقت پیشگویانه/توصیفی.
۲-۳ سادگی در ارائه مدل داده کاوی.
۱٫ نمونه گیری سیستمی.
۲٫ نمونه گیری تصادفی.
۳٫ نمونه گیری لایه ای.
۴٫ نمونه گیری معکوس.
مقدمه
امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها، نیاز به ابزاری است تا بتوان داده های ذخیره شده پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد.
با استفاده ار پرسش های ساده درSQL و ابزارهای گوناگون گزارش گیری معمولی، می توان اطلاعاتی را در اختیار کاربران قرار داد تا بتوانند به نتیجه گیری در مورد داده ها و روابط منطقی میان آنها بپردازند اما وقتی که حجم داده ها بالا باشد، کاربران هر چقدرحرفه ای و با تجربه باشند نمی توانند الگوهای مفید را در میان حجم انبوه داده ها تشخیص دهند و یا اگر قادر به این کار هم با شند، هزینه عملیات از نظر نیروی انسانی و مالی بسیار بالا است.
ارسال نظر