Locked دریافت Toolbar آفتاب
مقالات کامپیوتر و فناوری‌اطلاعات فناوری اطلاعات معرفی داده کاوی
۳۰ آبان ۱۳۸۸
  ◊   دفعات نمایش : ۱۱۵۸        Saturday, Nov 21, 2009
معرفی داده کاوی
داده کاوی یا کشف دانش در پایگاه داده ها (KDD) علم نسبتا تازه ای است که با توجه پیشرفت کشور در زمینه IT و نگاه های ویژه به دولت الکترونیک و نفوذ استفاده از سیستم های رایانه ای در صنعت و ایجاد بانک های اطلاعاتی بزرگ توسط ادارات دولتی، بانک ها و بخش خصوصی نیاز به استفاده از آن به طور عمیقی احساس می شود.
معرفی داده کاوی

داده کاوی [۱] یا کشف دانش در پایگاه داده ها [۲] ( KDD ) علم نسبتا تازه ای است که با توجه پیشرفت کشور در زمینه IT و نگاه های ویژه به دولت الکترونیک و نفوذ استفاده از سیستم های رایانه ای در صنعت و ایجاد بانک های اطلاعاتی بزرگ توسط ادارات دولتی، بانک ها و بخش خصوصی نیاز به استفاده از آن به طور عمیقی احساس می شود. داده کاوی یعنی کشف دانش و اطلاعات معتبر پنهان در پایگاه های داده. یا به بیان بهتر تجزیه و تحلیل ماشینی داده ها برای پیدا کردن الگوهای مفید و تازه و قابل استناد در پایگاه داده های بزرگ ، داده کاوی نامیده می شود. داده کاوی در پایگاه های داده کوچک نیز بسیار پرکاربرد است و از نتایج و الگوهای تولید شده بوسیله آن در تصمیم گیری های استراتژیک تجاری شرکتهای کوچک نیز می توان بهره های فراوان برد. کاربرد داده کاوی در یک جمله را این گونه می توان بیان کرد : " داده کاوی اطلاعاتی می دهد ، که شما برای گرفتن تصمیم هوشمندانه ای درباره مشکلات سخت شغلتان به آنها نیاز دارید" [۳] .

● مثالی کلاسیک از کاربرد داده کاوی

اغلب تجارت ها به تصمیم گیریهای استراتژیک و یا اتخاذ خط مشی های جدید برای خدمت رسانی بهتر به مشتریان نیاز دارند. به عنوان مثال فروشگاهها آرایش مغازه خود را برای ایجاد میل بیشتر به خرید مجدداً طراحی می کنند. این مثال به داده هایی در مورد رفتار مصرفی گذشته مشتریان برای تعیین الگوهایی به وسیله داده کاوی، نیاز دارند.

برای روشن تر شدن مسئله می توان مثال را اینگونه بیان کرد که در یک فروشگاه زنجیره ای پس از داده کاوی مشخص میشود که درصدی از مشتریان خرید تلویزیون ، میز تلوزیون و گلدان کریستالی را هم در همان روز و بعد از خرید تلوزیون میخرند.مدیر فروشگاه می تواند بلافاصله دستوراتی صادر کند که براساس مدلهای تلوزیون موجود میزهایی و براساس مدل میزها گلدانهای کریستالی برای فروش سفارش داده شود و غرفه های جنبی غرفه تلویزیون را به میز و گلدان کریستالی اختصاص دهد. مطمئنا حتی پس از مدت کوتاهی سود حاصل از این بخش از فروشگاه به طور قابل ملاحضه ای ترقی خواهد کرد.

در واقع ابزار داده کــــاوی، داده را می گیرد و یک تصویر از واقعیت به شکل مدل می سازد، این مدل روابط موجود در داده ها را شرح می دهد.

برای بهبود بهره وری از یک فروشگاه داده کاوی از داده های انبار داده ، مدل هایی را ارائه میدهد که بیانگر این هستند که چه محصولات یا خدماتی، به چه مشتریانی، در چه زمانی و از طریق چه کانالی عرضه شود.

بیشتر شرکتها، بانکهای داده ای عظیمی شامل داده های بازاریابی، منابع انسانی و مالی را دارا هستند. بنابراین، سرمایه گذاری در زمینه انبار داده، یکی از اجزای حیاتی در استراتژی مدیریت ارتباط با مشتری است.

رابطه مشتری با زمان تغییر می کند و چنانچه تجارت و مشتری درباره یکدیگر بیشتر بدانند این رابطه تکامل و رشد می یابد. چرخه زندگی مشتری چارچوب خوبی برای به کارگیری داده کاوی در مدیریت ارتباط با مشتری فراهم می کند. در بخش ورودی داده کاوی، چرخه زندگی مشتری می گوید چه اطلاعاتی در دسترس است و در بخش خروجی آن، چرخه زندگی می گوید چه چیزی احتمالاً جالب توجه است و چه تصمیماتی باید گرفته شود. داده کاوی می تواند سودآوری مشتری های بالقوه را که می توانند به مشتریان بالفعل تبدیل شوند، پیش بینی کند و اینکه تا چه مدت به صورت مشتریان وفادار خواهند ماند و چگونه احتمالاً ما را ترک خواهند کرد.

بعضی از مشتریان مرتباً مراجعاتشان را به شرکتها برای کسب مزیتهایی که طی رقابت میان آنها به وجود می آید، تغییر می دهند. در این صورت شرکتها می توانند هدفشان را روی مشتریانی متمرکز کنند که سودآوری بیشتری دارند.

بنابراین می توان از طریق داده کاوی ارزش مشتریان را تعیین، رفتار آینده آنها را پیش بینی و تصمیمات آگاهانه ای را در این رابطه اتخاذ کرد.

● از کاربرد های داده کاوی می توان به نمونه های زیر اشاره کرد :

▪ بانکداری :

ـ از جالب توجه ترین کاربرد های داده کاوی می توان به کشف پول شویی اشاره کرد.

ـ تشخیص مشتریان ثابت و همیشگی

ـ تعیین مشتریان استفاده کننده از یک سرویس خاص

▪ بیمه :

ـ پیش گویی میزان استقبال از بیمه نامه های جدید

ـ تشخیص کلاهبرداری ها و مشخص کردن رفتار های نا متناسب

ـ تشخیص نیاز مشتریان و خواسته های آنها

ـ تشخیص تخلفات پزشکی

واضح است که زمینه استفاده از داده کاوی بی نهایت گسترده است.و دو مثال فوق به خاطر درک راحت تر انتخاب شده اند.

داده کاوی شباهت زیادی به تحلیل های آماری دارد. ولی داده کاوی از جهات زیادی با آمار متفاوت است و مزیت های زیادی نسبت به آمار دارد. جالب ترین تفاوت داده کاوی با تحلیل های آماری این است که در آمار ما فرضیه ای طرح می کنیم و با استفاده از تحلیل های آماری به اثبات یا رد فرضیه می پردازیم اما داده کاوی به فرضیه احتیاجی ندارد.در واقع ابزار داده کاوی فرض می کند که شما خود هم نمی دانید به دنبال چه می گردید. و این نکته ای است که باعث می شود کار آمدی داده کاوی در مواقع بروز مشکل نمایان شود . برای مثال ما در آمار فرض می کنیم که دو گروه فاصله ای باهم ارتباط دارند سپس با استفاداه از ضریب هم بستگی پیرسون مشخص می کنیم که ارتباط وجود دارد یا خیر . ولی داده کاوی بدون توجه به اینکه ما اینگونه فرضی داشته باشیم یا نه با کاوش میان داده ها اگر ارتباطی مخفی معنی داری وجود داشته باشد آن را به اطلاع ما می رساند .تفاوت بعدی آمار و داده کاوی در این است که آمار فقط می تواند از داده های عددی استفاده کند ولی داده کاوی از داده های غیر عددی هم استفاده می کند . تفاوت های دیگری هم میان آمار و داده کاوی وجود دارد که بحث در مورد آنها در حوصله این مقاله نمی گنجد.

اما برای اولین بار در سال ۱۹۵۰ از رایانه برای تحلیل و ذخیره پایگاه داده ها استفاده شد. ولی حجم اطلاعات و میزان رشد آنها به قدری زیاد بوده است که هم اکنون کسی از میزان اطلاعات ذخیره شده در پایگاه داده های سراسر دنیا به صورت دقیق اطلاعی ندارد ولی مطمئنا حجم اطلاعات و مخصوصا سرعت رشد آنها به قدری زیاد شده که آمار شناسان و تحلیل گران در بررسی و تحلیل پایگاههای داده در زمینه های مختلف ناتوانند. بعضی از پایگاه داده ها به قدری بزرگ و پیچیده شده اند که تحلیل روابط و استخراج اطلاعات مفید پنهان شده در آنها واقعا از ظرفیت ذهنی بشری فراتر رفته است . از زمانی که رشد پایگاه های داده و حجم اطلاعات ، سرعت گرفت و میزان داده ها افزایش یافت ، نیاز به تحلیل ماشینی داده ها و استخراج سریع و دقیق دانش نهفته در آنها احساس شد. شاید بتوان لوول (۱۹۸۳) را اولین شخصی دانست که گزارشی در مورد داده کاوی تحت عنوان « شبیه سازی فعالیت داده کاوی » ارائه نمود. [۴]

عمل داده کاوی از یک پایگاه داده به چند مرحله مشخص تقسیم می شود که ما در این مقاله به معرفی و توضیحی مختصر در مورد هر یک از این مراحل اکتفا می کنیم :

● مرحله اول : تشکیل انبار داده .

با توجه به عنوان ، این مرحله برای تشکیل محیطی پیوسته و یک پارچه جهت انجام مراحل بعدی و داده کاوی در آن، انجام می گیرد.در حالت کلی انبار داده مجموعه پیوسته و طبقه بندی شده است که دائما در حال تغییر بوده و دینامیک است که برای کاوش آماده می شود.

● مرحله دوم : انتخاب داده ها

در این مرحله برای کم کردن هزینه های عملیات داده کاوی، داده هایی از پایگاه داده انتخاب می شوند که مورد مطالعه هستند و هدف داده کاوی دادن نتایجی در مورد آنهاست.

● مرحله سوم : تبدیل داده ها .

مشخص است برای انجام عملیات داده کاوی لزوما باید تبدیلات خاصی روی داده ها انجام گیرد ممکن است این تبدیلات خیلی راحت و مختصر مثل تبدیل byte به integer باشد یا خیلی پیچیده و زمان بر و با هزینه های بالا مثل تعریف صفات جدید و یا تبدیل و استخراج داده ها از مقادیر رشته ای و ... باشد.

● مرحله چهارم : کاوش در داده ها .

در این مرحله است که داده کاوی انجام می شود.در این مرحله با استفاده از تکنیک های داده کاوی داده ها مورد کاوش قرار گرفته ، دانش نهفته در آنها استخراج شده و الگو سازی صورت می گیرد.

● مرحله پنجم : تفسیر نتیجه .

در این مرحله نتایج و الگو های ارائه شده توسط ابزار داده کاو مورد بررسی قرار گرفته و نتایج مفید معیین می شود.

طرز کار ابزار داده کاو اینگونه است که ابزار به دنبال اثبات این است که وجود چیزی به معنای وجود چیز دیگری است و سعی می کند در درجه اول از توالی ارتباطات برای کشف یک الگو بهره بگیرد و در نهایت اطلاعات بدست آمده را دسته بندی کند تا به الگوی خاصی برسد که بتواند آن را براساس فاکتورهای داخی به مخاطبش ارائه دهد.

همچنین در داده کاوی از الگوریتم های ژنتیک و شبکه های عصبی هم استفاده می شود.شبکه های عصبی به علت کار آمدی در حل مسائل پیچیده و بزرگ مورد استفاده اند و کاربرد الگوریتم های ژنتیک در داده کاوی برای جستجو و ساختن یک مدل بهینه در میان مدل های بدست آمده است ، به این گونه که مدل های اولیه روی کرومزوم هایی قرار می گیرند و با رقابت بر سر انتقال صفات به نسل بعد ، بهترین مدل و لایق ترین آنها به کاربر ارائه می شوند.

داده کاوی امروز گسترش زیادی یافته است به طوری که اکثر نرم افرار های پایگاه داده ای مثل SQL Server و ORACLE نیز شامل ابزارهایی داده کاوی شده اند ولی هنوز نرم افزار های تخصصی داده کاوی همچون Intelligent Miner , Darwin , Mine Set, Knowledge Studio, Data Mind از مهمترین ابزار های داده کاوی اند.

۱ CHRIS RYGIELSKI, “DATA MINING TECHNIQUES FOR CUSTOMER RELATIONSHIP MANAGEMENT”, TECHNOLOGY IN SOCIETY, ۲۰۰۲ .
۲ HILL L., “CRM: EASIER SAID THAN DONE”, INTELLIGENT ENTERPRISE, ۱۹۹۹
۴ Microsoft Visual Studio .Net Documentation
۵ Client/Server Survival Guide by Robert Orfali, Dan Harkey, Jeri Edwards
۶ شاه سمندی، پرستو «داده کاوی در مدیریت ارتباط با مشتری» (۱۳۸۴)، مجله تدبیر شماره ۱۵۶.
۷ Hand. D.J (۱۹۹۸): "Review of Data mining", The American statistician, ۵۲, ۱۱۲ ۱۱۸.
۸ Jeffery W. Seifert , Analyst in information science and Technology Policy, ‘ Data Mining : An Overview ‘ December ۲۰۰۴.
ایرانیکا ( www.iranika.ir )
داده‌کاوی
دریافت مقاله ثبت مقاله آفتاب من چاپ بازگشت
نشر بین‌رسانه‌ای چیست؟
تغییر عادات در مصرف اطلاعات، افزایش تقاضا برای اطلاعات تخصصی و تمایل به شخصی‌سازی اطلاعات از جمله چالش‌هایی هستند که در برابر رویه‌ها و عملکردهای سنتی رسانه‌ای قد برافراشته‌اند نسل جدید مخاطبان که به مصرف بیشتر از داده‌های مولتی‌مدیایی تمایل دارد، خواستار …
۶ مهر ۱۳۸۸
انهدام کامل اطلاعات
آیا تا به حال احساس ناامنی کرده اید؟ خب مسلماً جوابتان آری است. منظورم این است که آیا احساس کرده اید که باید بعضی از اطلاعات روی هاردتان ...
۱۵ شهریور ۱۳۸۸
اطلاعات گرایی و توسعه در عصر اطلاعات
یکی از مهمترین بحث های کنونی در زمینه توسعه در جهان بحث توسعه اطلاعاتی است. توسعه اطلاعاتی منوط به شناخت شاخص های این نوع از توسعه در جهان است. از این لحاظ این مقاله در پی معرفی توسعه اطلاعاتی و پایه ها و مبانی این نوع از توسعه است.
۱۳ شهریور ۱۳۸۸
سواد اطلاعاتی نیاز حیاتی جامعه اطلاعاتی
سواد اطلاعاتی مفهومی است که در نتیجه تحولات و تغییرات سریع در فن‌آوری‌های اطلاعاتی پیدا شده و مجموعه مهارت‌هایی است که فرد به‌منظور ادامه حیات در جامعه اطلاعاتی به آن‌ها نیازمند است.
۲۸ خرداد ۱۳۸۸
بزرگراه پرخطر اطلاعات
اینترنت شیوه های ارتباطی، اجتماعی را کاملا دگرگون ساخته است و نگرانی هایی بویژه در ارتباط با تربیت اخلاقی و آموزش موثر والدین ایجاد نموده است.
۱۸ خرداد ۱۳۸۸
مرگ فجیع موتور سوار
مرگ فجیع موتور سوار
شرط فرمانده سپاه ولی امر برای بازگشت خاتمی به عرصه سیاست
شرط فرمانده سپاه ولی امر برای بازگشت خاتمی به عرصه سیاست
خودكشی بی‌نتیجه زن جوان در مشهد
خودكشی بی‌نتیجه زن جوان در مشهد
بازیگر ارباب حلقه ها بخاطر آزار و اذیت همسر سابقش دستگیر شد !
بازیگر ارباب حلقه ها بخاطر آزار و اذیت همسر سابقش دستگیر شد !
چگونه کارمند خوش پوشی باشیم؟
چگونه کارمند خوش پوشی باشیم؟
لیدی گاگا بازهم با تظاهرات مردم روبرو شد !
لیدی گاگا بازهم با تظاهرات مردم روبرو شد !
مرگ دونفر تنها به خاطر یك فرغون شن!
مرگ دونفر تنها به خاطر یك فرغون شن!
مذاكرات بغداد چرا به نتیجه نرسید؟
مذاكرات بغداد چرا به نتیجه نرسید؟
یاریس گران بخریم یا ۲۰۶ محبوب؟
یاریس گران بخریم یا ۲۰۶ محبوب؟
آدم‌ها مثل صندوق پست هستند
آدم‌ها مثل صندوق پست هستند
 وبلاگ آفتاب 
معرفی آرشیو موسیقی
بسطامی، ایرج
 آلبوم مژده بهار
◊  خشم با دیوانگی آغاز می‌شود و با پشیمانی پایان می‌پذیرد . فیثاغورث  ◊