ارائه الگوریتمی برای ارزشیابی بیمه شدگان با استفاده از داده کاوی

مقدمه

داده‌کاوی یکی از موضوعات پرکاربرد و در حال رشد در عرصه مدیریت، حسابداری و اقتصاد است. به مدد سیستم‌های فناوری اطلاعات و نرم‌افزارهای مبتنی بر پایگاه داده، اکنون سازمان‌ها توان ذخیره حجم انبوهی از داده‌ها را پیدا کرده‌اند. داده‌کاوی فرایندی است که امکان استخراج اطلاعات معنادار از این پشته داده را فراهم می‌سازد. داده‌کاوی روشی است که به کشف دانش مبتنی بر شناسائی خودکار الگوها و رابطه‌ها می‌پردازد. یعنی به جای آنکه مدل سازی کنیم، مدل‌های موجود را کشف نمائیم.
داده کاوی یکی از روشهایی است که به وسیله آن الگوهای مفید در داده‌ها با حداقل دخالت کاربران شناخته می‌شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می‌دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند. در داده کاوی از تحلیل اکتشافی داده‌ها استفاده می‌شود که در آن بر کشف اطلاعات نهفته و ناشناخته از درون انبوهی از داده‌ها تاکید می‌شود. وجود حجمی انبوه از داده‌ها پیش‌فرض داده‌کاوی است. هر چه حجم داده‌ها بیشتر و روابط میان آنها پیچیده تر باشد داده‌کاوی اهمیت بیشتری پیدا می‌کند.
در بسیاری موارد از خوشه بندی به عنوان اولین گام فرایندهای داده كاوی یاد می‌شود كه قبل از سایر فرایند‌ها برای شناسایی گروهی از عناصر مشابه استفاده می‌شود. هدف از خوشه بندی تقسیم داده‌های موجود به چندین گروه است بطوریکه داده‌های گروه‌های مختلف باید حداکثر تفاوت ممکن را به هم داشته باشند و داده‌های موجود در یک گروه باید بسیار به هم شبیه باشند. روش‌های متعددی برای خوشه‌بندی داده‌ها وجود دارد.
علاوه بر پیشرفت ابزارهای مدیریت داده، افزایش قابلیت دسترسی به داده و کاهش نرخ نگهداری داده نقش ایفا می‌کند. در طول چند سال گذشته افزایش سریع جمع آوری و نگه داری حجم اطلاعات وجود داشته‌است. با پیشنهادهای برخی از ناظران مبنی بر آنکه کمیت داده‌های دنیا به طور تخمینی هر ساله دوبرابر می‌گردد. در همین زمان هزینه ذخیره سازی داده‌ها بطور قابل توجهی از دلار برای هر مگابایت به پنی برای مگابایت کاهش پیدا کرده‌است. مطابقا قدرت محاسبه‌ها در هر ۱۸ – ۲۴ ماه به دوبرابر ارتقاء پیدا کرده‌است این در حالی است که هزینه قدرت محاسبه رو به کاهش است. داده کاوی به طور معمول در دو حوزه خصوصی و عمومی افزایش پیدا کرده‌است. سازمانها داده کاوی را به عنوان ابزاری برای بازدید اطلاعات مشتریان کاهش تقلب و اتلاف و کمک به تحقیقات پزشکی استفاده می‌کنند. با این همه ازدیاد داده کاوی به طبع بعضی از پیاده سازی و پیامد اشتباه را هم دارد. اینها شامل نگرانی‌هایی در مورد کیفیت داده‌ای که تحلیل می‌گردد، توانایی کار گروهی پایگاههای داده و نرم‌افزارها بین ارگانها و تخطی‌های بالقوه به حریم شخصی می‌باشد. همچنین ملاحظاتی در مورد محدودیتهایی در داده کاوی در ارگان‌ها که کارشان تاثیر بر امنیت دارد، نادیده گرفته می‌شود.

داده کاوی به روش  TLRFM

مدل TLRFM به تحلیل رفتار و بیان تفاوت مشتریان با استفاده از پنج متغیر تازگی، تکرار، بار مالی ایجاد شده، مدت زمان ارتباط و نوع سرویس گیرنده می پردازد که در آن سه متغیر به صورت زیر تعریف شده اند.

1- اولین مراجعه یا Recency :

نشان دهنده مدت زمان اولین مراجعه به سازمان تا مراجعات بعدی است؛ هرچه این مدت کمتر باشد ارزش R بیشتر است.

2- تعداد تکرار مراجعات یا: Frequency

تعداد تکرار مراجعات به سازمان را در یک بازه مشخص نشان می دهد.
برای مثال دو بار در سال، دو بار در یک فصل یا دو بار در یک ماه. هر چه تعداد تکرار بیشتر باشد ارزش F بزرگ تر است.

3- بار مالی ایجاد شده برای سازمان یا Monetary :

نشان دهنده ارزش پولی صرف شده توسط سازمان برای هر بار مراجعه  مشتری در بازه ای خاص است. بیشتر بودن مقدار پول صرف شده بیانگر بالاتر بودن ارزش M  است.

4- طول مدت ارتباط مشتری با سازمان یا  : Length

براین اساس هرچه مدت ارتباط مشتری با سازمان بیشتر باشد بگونه ای که دارای کمترین قطعی در پرداخت حق بیمه داشته باشد دارای بیشترین ارزش است.

5- نوع بیمه مورد استفاده مشتری یا Type :

بر این اساس در صورتیکه نوع بیمه مشتری مورد حمایت دولت و یا دارای معافیت هایی در پرداخت حق بیمه کامل داشته باشد ارزش T کمتر و هرچقدر مشتری از معافیت کمتری در پرداخت حق بیمه استفاده کرده باشد ارزش T بیشتری دارد.

حال هر چه ارزش F و R بیشتر باشد احتمال آنکه بار مالی جدیدی برای سازمان صورت بگیرد بیشتر است. در مدل TLRFM فرض بر این است که مشتریانی که در هر یک از متغیرهای (R,F,M) دارای ارزش بالاتری هستند جزو پر هزینه ترین، و مشتریانی که دارای متغیر های (T,L) با ارزش بالا و با متغیر (M) با ارزش پائین هستند جزو بهترین مشتریان بحساب می آیند. راحتی محاسبه و قابل درک بودن و توانایی TLRFM در پیش بینی رفتار آینده مشتری وارزیابی منابع مالی سازمان مورد تائید است، لذا مدل TLRFM را به عنوان راهی برای اندازه گیری ارزش طول عمر مالی سازمان می توان بکار برد .
از مدل TLRFM می توان برای خوشه‌بندی مشتریان در مدیریت ارتباط با مشتری (CRM) استفاده کرد. در این مدل مشتریان براساس پنج ویژگی تازگی،تکرار ،بار مالی ایجاد شده ، مدت زمان ارتباط و نوع سرویس گیرنده دسته‌بندی می‌شوند. براساس حرف اول هر یک از این چهار ویژگی واژه TLRFM نوآوری شده است. این مدل برای خوشه‌بندی بسیار مورد استفاده قرار می‌گیرد. این مدل قابل پیاده سازی با نرم‌افزار SPSS می باشد .

مراحل انجام کار

عمل داده کاوی از یک پایگاه داده به چند مرحله مشخص تقسيم می شود که ما در این مقاله به معرفی و توضيحی مختصر در مورد هر یک از این مراحل اکتفا می کنيم .

1- تشکيل انبار داده

با توجه به عنوان، این مرحله برای تشکيل محيطی پيوسته و یک پارچه جهت انجام مراحل بعدی و داده کاوی در آن، انجام می گيرد. در حالت کلی انبار داده مجموعه پيوسته و طبقه بندی شده است که دائما در حال تغيير بوده و دیناميک است که برای کاوش آماده می شود.

2- انتخاب داده ها
در این مرحله برای کم کردن هزینه های عمليات داده کاوی، داده هایی از پایگاه داده انتخاب می شوند که مورد مطالعه هستند و هدف داده کاوی دادن نتایجی در مورد آنهاست .

3- تبدیل داده ها

مشخص است برای انجام عمليات داده کاوی لزوما باید تبدیلات خاصی روی داده ها انجام گيرد ممکن است این تبدیلات خيلی راحت و مختصر مثل تبدیل byte به integer باشد یا خيلی پيچيده و زمان بر و با هزینه های بالا مثل تعریف صفات جدید و یا تبدیل و استخراج داده ها از مقادیر رشته ای و … باشد.

4- کاوش در داده ها

در این مرحله است که داده کاوی انجام می شود. در این مرحله با استفاده از تکنيک های داده کاوی داده ها مورد کاوش قرار گرفته، دانش نهفته در آنها استخراج شده و الگو سازی صورت می گيرد .

5- تفسير نتيجه
در این مرحله نتایج و الگو های ارائه شده توسط ابزار داده کاوی مورد بررسی قرار گرفته و نتایج مفيد معيين می شود. طرز کار ابزار داده کاوی اینگونه است که ابزار به دنبال اثبات این است که وجود چيزی به معنای وجود چيز دیگری است و سعی می کند در درجه اول از توالی ارتباطات برای کشف یک الگو بهره بگيرد و در نهایت اطلاعات بدست آمده را دسته بندی کند تا به الگوی خاصی برسد که بتواند آن را براساس فاکتورهای داخی به مخاطبش ارائه دهد .

آینده:
در آینده نحوه پیاده سازی الگوریتم فوق را با استفاده از نرم افزار SPSS توضیح می دهیم .

منابع :

1-CHRIS RYGIELSKI, “DATA MINING TECHNIQUES FOR CUSTOMER RELATIONSHIP MANAGEMENT”, TECHNOLOGY IN SOCIETY, 2002 .
2- HILL L., “CRM: EASIER SAID THAN DONE”, INTELLIGENT ENTERPRISE, 1999
3- Microsoft Visual Studio .Net Documentation
4- Client/Server Survival Guide by Robert Orfali, Dan Harkey, Jeri Edwards
5 -شاهسمندي، پرستو «دادهآاوي در مديريت ارتباط با مشتري» (١٣٨٤ ،(مجله تدبير شماره .١٥٦
6- Hand. D.J (1998): “Review of Data mining”, The American statistician, 52, 112-118.
7- Jeffery W. Seifert , Analyst in information science and Technology Policy, ‘ Data Mining : An Overview ‘ December 2004.

علی اکبر طبیبی: اداره کل استان اصفهان – اداره فن آوری اطلاعات

aliakbartabibi[atsign]yahoo.com

درباره admin