پایان نامه Data Mining
197,000 تومان
فـرمت: DOC
تعداد صفحات: 91 صفحه
رشتــه : کامپیوتر
بصورت کامل ، مرتب ، قابل ویرایش و آماده چاپ میباشد.
توضیحات:
چکیده:
در دو دهه قبل تواناييهای فنی بشر برای توليد و جمعآوری دادهها به سرعت افزايش يافته است. عواملی نظير استفاده گسترده از بارکد برای توليدات تجاری، به خدمت گرفتن کامپيوتر در کسبوکار، علوم، خدمات دولتی و پيشرفت در وسائل جمعآوری داده، از اسکن کردن متون و تصاوير تا سيستمهای سنجش از دور ماهوارهای، در اين تغييرات نقش مهمی دارند.
بطور کلی استفاده همگانی از وب و اينترنت به عنوان يک سيستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات میکند. اين رشد انفجاری در دادههای ذخيره شده، نياز مبرم وجود تکنولوژیهای جديد و ابزارهای خودکاری را ايجاد کرده که به صورت هوشمند به انسان ياری رسانند تا اين حجم زياد داده را به اطلاعات و دانش تبديل کند. دادهکاوی به عنوان يک راه حل برای اين مسائل مطرح مي باشد. در يک تعريف غير رسمی دادهکاوی فرآيندی است، خودکار برای استخراج الگوهايی که دانش را بازنمايی ميکنند، که اين دانش به صورت ضمنی در پايگاه دادههای عظيم، انبارهداده و ديگر مخازن بزرگ اطلاعات، ذخيره شده است.
به لحاظ اینکه در چند سال اخیر مبحث دادهکاوی و اکتشاف دانش موضوع بسیاری از مقالات و کنفرانسها قرار گرفته و نرمافزارهای آن در بازار به شدت مورد توجه قرار گرفته، از اینرو در مقاله سعی بر آن شده تا گذری بر آن داشته باشیم.
در این مقاله درفصل مروری بر دادهکاوی خواهیم داشت . که به طور عمده به تاریخچه ، تعاریف، کاربردها وارتباط آن با انبار داده و OLAP خواهیم پرداخت. در پایان فصل مراحل فرایند کشف دانش از پایگاه دادهها را ذکر کردیم که دادهکاوی یکی از مراحل آن است.
در فصل 2 یکی از شیوههای دادهکاوی که از سبد خرید گرفته شده است توضیح داده شده است . در این فصل به شرح قوانین ارتباطی خواهیم پرداخت که در آن بعد از دستهبندی الگوریتمها ، الگوریتم Apriori ( که یک الگوریتم پایه در این زمینه است ) و الگوریتم FP-Growth ( یک الگوریتم جدید میباشد) را با شرح یک مثال توضیح میدهیم و در آخر آن دو را با هم مقایسه میکنیم .
در فصل 3 مباحث وبکاوی و متنکاوی را که در بسیاری از مراجع جزء کاربردهای دادهکاوی به حساب میآید شرح داده خواهد شد.
فهرست مطالب |
|
عنوان صفحه |
|
فهرست اشکال …………………………………………………………………………………………………………………………….. |
10 |
فهرست جداول ……………………………………………………………………………………………………………………………. |
11 |
فصل1: مقدمهای بر دادهکاوی …………………………………………………………………. |
13 |
1-1 تعریف دادهکاوی ………………………………………………………………………………………………………………….. |
15 |
2-1 تاریخچه دادهکاوی ……………………………………………………………………………………………………………….. |
16 |
3-1 چه چیزی سبب پیدایش دادهکاوی شده است؟ ……………………………………………………………………………. |
17 |
4-1 اجزای سیستم دادهکاوی …………………………………………………………………………………………………………. |
19 |
5-1 جایگاه دادهکاوی در میان علوم مختلف …………………………………………………………………………………….. |
21 |
6-1 قابلیتهای دادهکاوی ………………………………………………………………………………………………………………… |
22 |
7-1 چرا به دادهکاوی نیاز داریم؟ ……………………………………………………………………………………………………. |
23 |
8-1 دادهکاوی چه کارهایی نمیتواند انجام دهد؟ ……………………………………………………………………………… |
25 |
9-1 کاربردهای دادهکاوی …………………………………………………………………………………………………………….. |
25 |
1-9-1 کاربردهای پیشبینیکننده ……………………………………………………………………………………… |
27 |
2-9-1 کاربردهای توصیفکننده ………………………………………………………………………………………. |
27 |
10-1 ابزارهای تجاری دادهکاوی ……………………………………………………………………………………………………. |
28 |
11-1 دادهکاوی و انباردادهها …………………………………………………………………………………………………………. |
29 |
1-11-1 تعاریف انبارداده …………………………………………………………………………………………………. |
29 |
2-11-1 چهار خصوصیت اصلی انبارداده …………………………………………………………………………….. |
30 |
3-11-1 موارد تفاوت انبارداده و پایگاه داده ………………………………………………………………………… |
31 |
12-1 دادهکاوی و OLAP …………………………………………………………………………………………………………… |
33 |
1-12-1 OLAP …………………………………………………………………………………………………………… |
33 |
2-12-1 انواع OLAP ……………………………………………………………………………………………………. |
34 |
13-1 مراحل فرایند کشف دانش از پایگاه دادهها ………………………………………………………………………………. |
34 |
1-13-1 انبارش دادهها …………………………………………………………………………………………………….. |
35 |
2-13-1 انتخاب دادهها …………………………………………………………………………………………………….. |
36 |
3-13-1 پاکسازی- پیشپردازش- آمادهسازی …………………………………………………………………….. |
36 |
4-13-1 تبدیل دادهها ………………………………………………………………………………………………………. |
36 |
5-13-1 کاوش در دادهها (Data Mining) ……………………………………………………………………… |
37 |
6-13-1 تفسیر نتیجه ………………………………………………………………………………………………………… |
38 |
فصل 2: قوانین ارتباطی ………………………………………………………………… |
39 |
1-2 قوانین ارتباطی ………………………………………………………………………………………………………………………. |
40 |
2-2 اصول پایه …………………………………………………………………………………………………………………………….. |
41 |
1-2-2 شرح مشکل جدی ………………………………………………………………………………………………… |
41 |
2-2-2 پیمایش فضای جستجو …………………………………………………………………………………………… |
43 |
3-2-2 مشخص کردن درجه حمایت مجموعه اقلام ………………………………………………………………. |
45 |
3-2 الگوریتمهای عمومی ……………………………………………………………………………………………………………… |
45 |
1-3-2 دستهبندی ……………………………………………………………………………………………………………. |
45 |
2-3-2 BFS و شمارش رویدادها ……………………………………………………………………………………… |
46 |
3-3-2 BFS و دونیمسازی TID-list ………………………………………………………………………………. |
47 |
4-3-2 DFS و شمارش رویداد ………………………………………………………………………………………… |
47 |
5-3-2 DFS و دو نیمسازی TID-list ……………………………………………………………………………… |
48 |
4-2 الگوریتم Apriori ……………………………………………………………………………………………………………….. |
48 |
1-4-2 مفاهیم کلیدی ……………………………………………………………………………………………………… |
48 |
2-4-2 پیادهسازی الگوریتم Apriori ……………………………………………………………………………….. |
49 |
3-4-2 معایب Apriori و رفع آنها ……………………………………………………………………………………. |
54 |
5-2 الگوریتم رشد الگوی تکرارشونده ……………………………………………………………………………………………. |
55 |
1-5-2 چرا رشد الگوی تکرار سریع است؟ …………………………………………………………………………. |
58 |
6-2 مقایسه دو الگوریتم Apriori و FP-growth ………………………………………………………………………….. |
59 |
7-2 تحلیل ارتباطات …………………………………………………………………………………………………………………….. |
63 |
فصل 3: وبکاوی و متنکاوی ……………………………………………………….. |
65 |
1-3 وبکاوی …………………………………………………………………………………………………………………………….. |
66 |
1-1-3 الگوریتمهای هیتس و لاگسام ………………………………………………………………………………….. |
69 |
2-1-3 کاوش الگوهای پیمایش مسیر …………………………………………………………………………………. |
76 |
2-3 متنکاوی …………………………………………………………………………………………………………………………….. |
80 |
1-2-3 کاربردهای متنکاوی …………………………………………………………………………………………….. |
82 |
1-1-2-3 جستجو و بازیابی …………………………………………………………………………………. |
83 |
2-1-2-3 گروهبندی و طبقهبندی ………………………………………………………………………….. |
83 |
3-1-2-3 خلاصهسازی ………………………………………………………………………………………. |
84 |
4-1-2-3 روابط میان مفاهیم ………………………………………………………………………………… |
84 |
5-1-2-3 یافتن و تحلیل گرایشات ………………………………………………………………………… |
84 |
6-1-2-3 برچسب زدن نحوی (pos) ……………………………………………………………………. |
85 |
7-1-2-3 ایجاد Thesaurus و آنتولوژی به صورت اتوماتیک ………………………………….. |
85 |
2-2-3 فرایند متنکاوی ……………………………………………………………………………………………………. |
86 |
3-2-3 روشهای متنکاوی ………………………………………………………………………………………………… |
87 |
مراجع ……………………………………………………………………………………….. |
89 |
» بعد از درج ايميل بر روي گزينه "خريد آنلاين محصول" كليك كنيد تا به صفحه پرداخت آنلاين منتقل شويد .
» درج شماره تلفن همراه در مواقع لزوم فرآیند پیگیری خرید را ساده تر می کند .