کمتر، سی ستم‌های رایانهای متمرکزتر، شبکه قابل دسترسی گستردهتر، محدودیت زمانی و مکانی کمتر و در نهایت امنیت اطلاعات بانکی بیشتر خواهد بود [11 به نقل از 12].
بانکداری الکترونیک، اساساً به فراهم آوردن امکان دسترسی مشتریان به خدمات بانکی با استفاده از واسطههای ایمن و بدون حضور فیزیکی اطلاق می‌شود. بنا بر تعریف دیگری بانکداری الکترونیک به ایجاد محصولات و خدمات با بهای کم، از طریق کانال‌های الکترونیکی اطلاق می‌شود. این محصولات و خدمات میتواند شامل صورتحساب، وام، مدیریت سپرده‌ها، پرداخت‌های الکترونیکی و ایجاد محصولات و خدمات پرداخت‌های الکترونیکی همانند پول الکترونیکی باشند [11 به نقل از 12].
2-8- داده‌کاوی
سرعت روزافزون انباشت داده‌های حاصل از پردازش و تعاملات و تبادلات و ارتباطات موجود در فضای کسبوکار، به خصوص با وجود پیشرفت سیستمهای فناوری اطلاعات و ارتباطات37، مجموعه وسیعی از داده‌ها را پدید آورده است. طبق آخرین تحقیقات محققان، ظرفیت ذخیرهسازی داده‌ها در سراسر دنیا هر نه ماه دو برابر و داده‌های در دسترس نیز هر پنج سال دو برابر می‌شوند. همچنین دانشمندان پیشبینی کرده‌اند پایگاه‌های داده هر 5 سال یک بار به طور کامل فراموش ‌شده و داده‌های موجود در آن‌ها فقط در انبارهای داده ذخیره ‌میشوند.
هرچند در نگاه اول ممکن است به نظر برسد این داده‌ها بیفایده هستند، اما این داده‌ها میتوانند در صورت وجود ابزارهای مناسب، حکم معادن طلا را برای سازمانها، کسبوکارها و شرکتها داشته باشند. با این حال که ما از نظر دادهای غنی هستیم اما از نظر دانشی بسیار فقیریم [31]. اکثر سازمانها با فقر دانش مواجهاند و میتوان ادعا نمود این مسئله به سبب عدم شناخت سازمانها از ابزارهایی نظیر داده‌کاوی است که برخلاف ابزارهای گزارش گیری و آمارگیری قدیم میتوانند حجم عظیمی از داده‌ها را تحلیل نموده و الگوهای پنهان مفیدی از دل این داده‌ها آشکار نمایند.
داده‌کاوی به کشف الگوهای پنهان و استخراج دانش و اطلاعات از پایگاه داده‌های بسیار بزرگ اشاره دارد.
داده‌کاوی الگوریتمهایی چون دسته‌بندی38، خوشه‌بندی39، قوانین انجمنی40 و … را بر روی مجموعهای از داده‌ها41 اعمال نموده و بعد از تحلیل محتویات دادهای مدلهایی را به عنوان خروجی تولید مینماید. روش‌های آماری اساس کار داده‌کاوی را تشکیل میدهند.
2-8-1- مقایسه روش‌های آماری و داده‌کاوی
با پیشرفت روزافزون علوم در گذر زمان روش‌های قدیمی موجود جای خود را به روش‌های نوین میسپارند تا محدودیت‌های روش‌های گذشته را برطرف نمایند. علم آمار که یکی از شاخههای علوم ریاضیست نیز از این امر مستثنی نبوده و دست‌خوش تغییرات بسیاری گشته است. آمار، علمی است که به جمع آوری، توضیح و تفسیر داده‌ها میپردازد. اشتراک تکنیکهای آماری و داده‌کاوی بیشتر در تخمین و پیش‌بینی است. همچنین از آزمونهای آماری در ارزیابی نتایج داده‌کاوی نیز استفاده میشود. از این منظر میتوان روش‌های آماری را اساس کار داده‌کاوی دانست.
داده‌کاوی به صورت یک محصول قابل خریداری نمیباشد، بلکه یک رشته علمی و فرآیندی است که باید به صورت یک پروژه پیادهسازی شود. داده‌ها اغلب حجیم میباشند و به تنهایی قابل استفاده نیستند، بلکه دانش نهفته در داده‌ها قابل استفاده میباشد. بنابراین بهرهگیری از قدرت فرآیند داده‌کاوی جهت شناسایی الگوها و مدلها و نیز ارتباط عناصر مختلف در پایگاه داده جهت کشف دانش نهفته در داده‌ها و نهایتاً تبدیل داده به اطلاعات، روز به روز ضروریتر میشود [11].
پایه و اساس داده‌کاوی به دو مقوله آمار و هوش مصنوعی تقسیم شده است، که روشهای هوش مصنوعی به عنوان روشهای یادگیری ماشین در نظر گرفته میشوند. تفاوت اساسی بین روشهای آماری و روش‌های یادگیری ماشین بر اساس فرضها و یا طبیعت دادههایی که پردازش میشوند.
تفاوتهای موجود بین روش‌های آنالیز آماری و روش‌های داده‌کاوی در جدول 2-3 نشان داده شده است.
جدول 2-3 مقایسه روش‌های تحلیل آماری و داده‌کاوی [11 به نقل از 14]
روش
تحلیل آماری
داده‌کاوی
فرضیه
آمارشناسان همیشه با یک فرضیه شروع بکار میکنند.
دادهکاو به فرضیه احتیاجی ندارد.
نوع داده‌ها
از داده‌های عددی استفاده میکند.
ابزارهای داده‌کاوی میتوانند از انواع مختلف داده و نه فقط داده عددی استفاده کنند.
ایجاد روابط
آمارشناسان باید رابطههایی ایجاد کنند که با فرضیه ارتباط دارد.
الگوریتم‌های داده‌کاوی به صورت اتوماتیک روابط را ایجاد میکنند.
صحت داده‌ها
آنها میتوانند داده‌های نابجا و نادرست را در طول تحلیل مشخص کنند.
داده‌کاوی به داده‌های صحیح و درست نیاز دارد.
قابلیت تفسیر
آنها میتوانند نتایج کار خود را تفسیر و برای مدیران بیان کنند.
نتایج داده‌کاوی نسبتاً پیچیده است و نیاز به متخصصانی جهت تحلیل و بیان نتایج به مدیران دارد.

مطلب مرتبط :   دانلود پایان نامه دربارهساختار داده، مکان کنترل، مدل جاذبه

2-8-2- مفهوم داده‌کاوی
برای داده‌کاوی تعاریف بسیار زیادی ارائه شده است که البته بسیاری از این تعاریف بسیار نزدیک به یکدیگرند. در بعضی منابع داده‌کاوی را با اصطلاحاتی نظیر کشف دانش معادل قرار دادهاند که باید این‌گونه اصلاح شود، داده‌کاوی یک گام اساسی در فرایند کشف دانش است.
اصطلاحات و عبارات بسیار دیگری نیز معادل با داده‌کاوی بکار رفتهاند که معانی مشابه و گاهی متفاوت دار
ند مانند، کاوش دانش از پایگاه داده، استخراج دانش42، تحلیل الگوی داده43، لایروبی داده44 و باستانشناسی45 [11].
داده‌کاوی یک گام از فرایند کشف دانش از پایگاه داده است و به الگوریتمهایی که برای استخراج الگو از داده‌ها بکار میرود، گفته میشود. اطلاعات حاصل میتواند به عنوان ورودی برای تشکیل مدل دسته‌بندی و یا پیشبینی، یا بهبود یک مدل موجود بکار رود [53]. داده‌کاوی جستجو و یا کاوش46 دانش (الگوهای دلخواه) از مقادیر زیاد داده‌های موجود است [31].
در تعریفی دیگر داده‌کاوی به این صورت تعریف شده است: به‌کارگیری الگوریتم‌های یادگیری ماشین47 برای یافتن الگوهای نهفته از ارتباطات موجود در بین عناصر دادهای موجود در یک مجموعه داده بسیار بزرگ که میتواند منجر به افزایش سود شود [26].
داده‌کاوی یک متدولوژی بسیار قوی و با پتانسیل بالا میباشد که به سازمانها کمک میکند که بر مهم‌ترین اطلاعات از مخزن داده های خود تمرکز نمایند [52].
داده‌کاوی به فرایند استخراج اطلاعات نهفته، قابل فهم، قابل تعقیب از پایگاه داده‌های بزرگ و استفاده از آنها در تصمیمگیریهای تجاری مهم اطلاق میشود [13].
فرایند داده‌کاوی را میتوان به عنوان سیستمی تصمیمیار تلقی نمود که سازمان و مدیران آن را قادر میسازد از داده‌های خام به گنجینههای دانشی دست یابند و از این دانش در مسیر اتخاذ استراتژی‌های سازمانی بهره گیرند.
اگر هرم داده‌ها را به صورت زیر در نظر بگیریم:

شکل 2-6 سیر تکامل در هرم دانش [11]
با آگاهی از تعریف داده‌کاوی و نگاهی به هرم بالا بهتر میتوان به نقش داده‌کاوی در سازمانها پی برد. داده‌کاوی سبب میشود که سازمانها از سطح داده به سطوح بالاتر دانش و الگوهای ناشناخته برسند. الگوهای استخراج شده میتوانند رابطهای بین ویژگیها و مشخصات سیستم مانند نوع تقاضا و نوع مشتری، پیشبینیهای آینده بر اساس مشخصات سیستم، قوانین (اگر-آنگاه) بین متغیرهای سیستم، دستهبندیها و خوشهبندیهای اشیاء و رکوردهای شبیه به هم در یک سیستم و غیره باشند [11 به نقل از 52].

2-8-3- داده‌کاوی و کشف دانش
داده‌کاوی را میتوان به عنوان ابزاری جهت کشف دانش از پایگاههای داده تعریف نمود. داده‌کاوی یک گام در فرایند کشف دانش از پایگاه داده48 است که با استفاده از الگوریتم‌های کشف و تحلیل داده‌ها تعداد خاصی الگو یا مدل را از روی داده‌ها تولید میکند.
الگوی زیر مراحل استخراج دانش مشتری به کمک داده‌کاوی در سازمان را نمایش می‌دهد.
شکل 2-7 گام‌های فرایند تولید دانش از پایگاه داده‌ها [31و53]
این الگو گام‌های فرایند کشف دانش از پایگاه داده را در [53] به صورت زیر نشان داده است:
چنانچه از نمایش الگوی فوق برداشت میشود، ابتدا باید شناسایی دامنه فعالیت‌های کسبوکار صورت گرفته و دسترسی به داده‌ها مقدور گردد. داده‌ها در اینجا میتواند مجموعهای از حقایق، الگوها و یا خبرگی باشد.
در مرحله بعد با توجه به اهداف تعیین شده مورد نظر ذینفعان سازمان (مدیران، کارمندان، سرپرستان شعب، کاربران، خبرگان و مشاورین فناوری اطلاعات)، رکوردهای مورد نیاز توسط دادهکاو از میان حجم عظیم داده‌های سازمان مورد نظر انتخاب میشوند. در این مرحله حجم انبوه داده‌ها به داده‌های هدف کاهش داده میشود.
برای آماده‌سازی بخش داده‌های انتخابی باید عملیات پیشپردازشی روی آنها صورت گیرد. این عملیات شامل جمع آوری اطلاعات لازم برای مقداردهی به مقادیر رکوردهای از قلم افتاده، تشخیص داده‌های متفاوت و هماهنگی آنها با بقیه، جمع آوری اطلاعات لازم برای اصلاح یا حذف داده‌های نامناسب49 میباشد. محصول این مرحله داده‌های پیش‌پردازش شده خواهد بود.
گام بعد گزینش داده‌ها با هدف کاهش حجم آنها و یافتن ویژگیهایی از داده‌ها با توجه به هدف تعیین شده برای کسبوکار خواهد بود. با کاهش حجم داده‌ها یا روش‌های تغییرات آن‌ها حجم داده‌ها میتواند به مقدار مفید و مؤثری کاهش یابد.
مرحله بعد اعمال یک یا چند الگوریتم (مانند کلاسیفایرها50 و یا شبکه‌های عصبی51 و …) از بین الگوریتم‌های موجود و یا ابتکاری داده‌کاوی بر روی دادههاست. حاصل این مرحله یک یا چند مدل و یا الگو خواهد بود.
در گام بعد با تحلیل، ارزیابی و تفسیر الگوهای معنادار کشف شده، دانش استخراج میگردد. دانش استخراج شده میتواند به صورت قواعدی مستند شود.
یک الگو زمانی میتواند به عنوان دانش تلقی شود که :
به سادگی برای افراد قابل فهم باشد.
اعتبار آن از یک حد آستانهای52 پایینتر نباشد.
دانش جدیدی متناسب با اهداف تعیین شده سازمان ارائه دهد.
کاربردی باشد [1].
2-8-4- فرایند داده‌کاوی
داده‌کاوی، فرایندی خلاقانه است که دانش و مهارتهای گوناگونی را میطلبد. وجود یک استاندارد جهت انجام این فرایند به تبدیل مشکلات کسبوکار به مسائل داده‌کاوی، گزینش روش‌های داده‌کاوی و تبدیل داده‌ها متناسب با نوع کسبوکار، معنا دادن به ارزیابی اثربخشی و مستندسازی نتایج اهمیت فراوان دارد.
چرخه CRISP-DM53 فرایند استانداردی54 است که با هدف ارائه چارچوبی برای اجرای پروژههای داده‌کاوی بزرگ، یا هزینه کمتر، قابلیت اطمینان بیشتر، قابلیت مدیریت بیشتر و سریعتر توسعه یافت [50].
مدل مرجع CRISP-DM نمای کلی از چرخه عمر55 یک پروژه داده‌کاوی را نشان می‌دهد. این مدل شامل فازهای یک پروژه، کارهای لازم برای انجام هر فاز و خروجیهای هر فاز است
.
چرخه عمر یک پروژه داده‌کاوی چنانچه در شکل 2-8 نشان داده شده است به شش فاز شکسته میشود. توالی فازها اجباری نیست بلکه این ترتیب مرسومترین، مهمترین و پر تکرارترین وابستگی بین فازها را نشان می‌دهد. در مورد پروژههای خاص این ترتیب بستگی به این دارد که خروجی کدام فاز و یا عمل خاص نیازمند اجرای فاز بعدی است [50].
حلقه بیرونی مربوط به طبیعت پروژههای داده‌کاوی است. بدین معنی که پروژه داده‌کاوی با تولید یک راهکار خاص در زمان مشخص پایان نمییابد بلکه با اجرای یک دور فرایند داده‌کاوی در سازمان و اجرای آن راهکار در سازمان، ممکن است نتایجی حاصل شود که سؤالات جدیدی از کسبوکار را برانگیزد و این نیازمند تکرار دو و یا چند باره چرخه خواهد بود.

مطلب مرتبط :   پایان نامه با کلید واژگانروایی، روشهای، عناوین

شکل 2-8 متدولوژی فرآیند استاندارد میان صنعتی داده‌کاوی (CRISP-DM) [50]
مدل فرایند CRISP-DM شامل فازهای زیر میباشد:
گام درک موقعیت کسبوکار56
گام درک داده‌ها57
گام پیشپردازش داده‌ها58
گام مدل‌سازی59
گام ارزیابی60
گام به‌کارگیری61
در ادامه هر یک از این گامها به طور خلاصه توضیح داده میشود.
درک موقعیت کسب و کار: این گام، بخش آغازین مدل CRISP-DM میباشد

Comments (0):

Write a comment: