تارا فایل

بررسی و ارزیابی ریسک مشتریان اعتباری


 مقدمه
یکی از موضوعات مهم که در تخصیص اعتبارات بانکی حائز اهمیت می باشد، بررسی و ارزیابی ریسک مشتریان اعتباری می باشد. بررسی و ارزیابی امکان حصول یا عدم حصول به نرخ بازده پیش بینی شده در ارزیابی پروژه های سرمایه ای را ریسک می نامند. به عبارت دیگر عدم اطمینان در مورد دریافت عایدات آتی سرمایه گذاری را ریسک می گویند. چرخه های تجاری، تورم، اوضاع سیاسی و بسیاری از عوامل دیگر بر عدم اطمینان نسبت به آینده تاثیر می گذارد. یکی از بهترین اصول سرمایه گذاری در کلیه زمینه ها آنست که ریسک حاصل از سرمایه گذاری می بایست متناسب با بازده آن سرمایه گذاری باشد، از این رو شناسایی مهارتهای تجزیه و تحلیل اعتباری در بانکها از اهمیت ویژه ای برخوردار خواهد بود.
آنچه که در اعطاء تسهیلات اعتباری از اهمیت ویژه ای برخوردار است بررسی و ارزیابی احتمال بازگشت اصل سرمایه بهمراه سود حاصل از اعطای اعتبار است، در حقیقت بررسی و ارزیابی ریسک صنعت بانکداری دارای نگرشی هم عرض با بخش سرمایه گذاری می باشد، در مورد سرمایه گذاری در یک شرکت خاص، سرمایه گذار به مطالعه و ارزیابی وضعیت شرکت مربوط پرداخته و پس از تجزیه و تحلیل های مالی و اطمینان از اینکه سرمایه گذاری در شرکت مربوط دارای منافع بیشتری نسبت به سایر شرکتها می باشد، در آن شرکت اقدام به سرمایه گذاری می نماید و هر زمان که نیاز به مبلغ سرمایه گذاری پیدا نماید به سهولت می تواند با اندکی تغییر قیمت سهام خود را فروخته و سرمایه اش را وصول نماید. لیکن این موضوع در صنعت بانکداری از یک بعد دیگر مورد توجه قرار می گیرد، بدین معنی که در این بخش، زمانی که یک شرکت به عنوان مشتری اعتباری برای دریافت وام به بانک مراجعه نموده و نسبت به دریافت تسهیلات اقدام می نماید بانک مورد نظر نیز پس از بررسی اسناد و مدارک شرکت نسبت به اعطاء تسهیلات به آن شرکت اقدام می نماید.
بنابراین بانکها به مثابه یک سرمایه گذار ایفای نقش می نمایند، بدین معنی که بانک نیز سعی می کند تسهیلات بانکی را به شرکتی اعطاء نماید که آن شرکت توان پرداخت اصل وام را به همراه سود حاصل از آن در موعد مقرر داشته باشد. لیکن در اینجا تنها تفاوتی که بین بانک و یک سرمایه گذار واقعی وجود دارد آنست که از یک سو بانک ها سود ثابتی را بر هر یک از انواع عقود اسلامی در نظر گرفته و در موعد مقرر به همراه اصل وام دریافت می نماید، بنابراین در اینجا آنچه اهمیت می یابد آنست که بانک ها سعی می کنند تسهیلات خود را به شرکتهایی اعطاء نمایند که ضمن برخورداری از ریسک پایین بتوانند بازده متناسب با سود تسهیلات اعطایی را داشته باشند، از اینرو در صورتی که یک شرکت دارای سود بسیار بیشتر از سود حاصل از اعطاء تسهیلات باشد، در دریافت تسهیلات اعتبار، از دیدگاه بانک با شرکتی که دارای بازدهی متناسب با سود تسهیلات اعطایی است یکسان خواهد بود، لذا بانک سعی می نماید در میان این شرکتها، شرکتی را انتخاب نماید که دارای حداقل ریسک باشد، از سوی دیگر بانک ها در هنگام وصول تسهیلات اعتباری که به مشابه سرمایه بانک تلقی می شودف نمی توانند مشابه یک سرمایه گذار واقعی عمل نمایند، بدین معنی که در هنگام اعطاء تسهیلات زمانی را برای بازپرداخت تعیین نموده و از مشتریان خود می خواهند که در موعد مقرر نسبت به بازپرداخت اصل وام به همراه سود آن اقدام نمایند به عبارت دیگر امکان بازپرداخت وام قبل از موعد مقرر میسر نمی باشد. در هر حال در اینجا نیز ارزیابی ریسک شرکتهای درخواست کننده تسهیلات برای بانک ها از اهمیت ویژه ای برخوردار می باشد. بدین معنی که اگر یک شرکت نتواند بصورت موفقیت آمیز در محیط اقتصادی عمل نماید، در زمان بازپرداخت تسهیلات اعطایی با مسائلی روبرو خواهد شد و به تبع آن بانک اعطاء کننده تسهیلات را نیز با مشکلات عدیده ای مواجه خواهد نمود.
ریسک اعتباری
ارائه تسهیلات مالی یکی از فعالیتهای مهم نظام بانکی تلقی می شود. برای اعطای تسهیلات باید درجه اعتبار و قدرت بازپرداخت اصل و فرع دریافت کننده تسهیلات را تعیین نمود. ریسک اعتباری بطور خلاصه به عدم ایفای تعهدات دریافت کننده تسهیلات (وام گیرنده) یا طرف قرارداد بانک بر طبق ضوابط توافق شده اطلاق می گردد.
این ریسک به حالتهای زیر خود را نشان می دهد:
1. احتمال کاهش توان بازپرداخت اصل و فرع تسهیلات دریافتی توسط مشتری
2. احتمال عدم بازپرداخت اصل و فرع تسهیلات دریافتی توسط مشتری
3. احتمال معوق شدن بازپرداخت اصل و فرع تسهیلات دریافتی توسط مشتری
مشکلات و بحرانهای مشاهده شده در نظام بانکی کشورها عمدتاً ناشی از ضعف در مدیریت ریسک اعتباری بوده است.
تمرکز اعطای تسهیلات با حجم بالا به یک شرکت، یک گروه صنعتی و حتی در یک صنعت از عوامل افزایش دهنده این ریسک تلقی می شوند. اعطای تسهیلات به شرکتها و یا تشکلهای صنعتی مادر که به صورت شرکتهای تار عنکبوتی مالک سهام یکدیگر می باشند بدون توجه به درجه اعتباری شرکت مادر و صورتهای مالی تلفیقی آن بسیار خطرناک می باشد.
بحرانهای بانکی مشاهده شده در ژاپن، کره و دیگر کشورهای آسیای جنوب شرقی بعلت عدم توجه به این پدیده بوده است. استانداردهای کمیته بال اعطای تسهیلات به نهادها و افرادی که توانایی نفوذ در مدیریت بانکها را دارند (سیاستمداران، مدیران دولتی و سهامداران و …) را بسیار منفی تلقی کرده و عامل افزایش ریسک اعتباری می داند. متاسفانه این پدیده در ایران زیاد مشاهده می شود و باعث بالا رفتن ریسک اعتباری نظام بانکی کشور شده است.
بعلت تاکید بانکهای اسلامی بر مشارکت سپرده گذاران در ریسک و سود دریافتی حاصل از تسهیلات اعطایی ریسک اعتباری اهمیت خاص پیدا می کند. در صورت مدیریت صحیح، ریسک اعتباری در بانکهای اسلامی کمتر از دیگر بانکها می باشد. بعبارت دیگر ماهیت مشارکتی بانکهای اسلامی کمتر از دیگر بانکها می باشد ریسک اعتباری را بعلت انتقال آن به سپرده گذاران کاهش می دهد. ضمناً ریسک اعتباری بانکهای دولتی بعلت حمایت و مصونیتهای نسبی در مقابل عدم بازپرداخت و یا سوخت تسهیلات اعطایی کاهش می یابد.
با توجه به اهمیت ریسک اعتباری در موفقیت بانکها و همچنین رشد و توسعه اقتصادی یک کشور بانکهای تجاری سعی می نمایند، قبل از اعطاء تسهیلات به مشتریان توانایی آنها را در بازپرداخت بدهیهایشان برآورد نمایند. برای این منظور اغلب از روشهای متعددی استفاده می شود. از جمله می توان به رتبه بندی مشتریان اشاره نمود. با توجه به تمرکز این پژوهش بر ریسک اعتباری، رتبه بندی مشتریان در این بخش بصورت تفصیلی آورده شده است.
رتبه بندی اعتباری
تعریف رتبه بندی
رتبه بندی چه توسط موسسات رتبه بندی انجام شود و چه توسط بانکها، یک هدف را دنبال می کند و آن مطالعه توانایی شرکت برای پرداخت بدهی آن می باشد. به عبارت دیگر کمی نمودن احتمال نکول مشتری در آینده است. بنابراین هدف رتبه ها اعلام کیفیت یک وام گیرنده و دورنمای بازپرداخت آن به بازار است. رتبه ها این قابلیت را دارند که برای مشاهده گران خارجی مثل مقامات نظارتی و شرکت کنندگان در بازار نسبت به یک شرکت در بازار اعتبار ایجاد نمایند. البته اعتبار اطلاعات رتبه بندی ارتباط نزدیکی با مقررات قابل قبول رتبه بندی دارد. با توجه به اهمیت رتبه بندی مشتریان موسساتی برای فعالیت در این زمینه تشکیل شده اند که از آن جمله می توان به موسسات رتبه بندی مودیز، استاندارد اندرپور، Thomson Bank watch, IBCA که به رتبه بندی ناشرین اوراق بهادار (مشتریان) و نیز اوراق بدهی اشتغال دارند اشاره نمود. این موسسات با استفاده از طریق ذیل می توانند کمک قابل ملاحظه ای به ارتقا کارایی بازار نمایند:
الف) دست یابی گسترده تر سرمایه گذاران نهادی به سرمایه
ب) انعطاف پذیری منابع تامین مالی (با کاهش هزینه ها بویژه برای ناشرین اوراق بهادار با رتبه های بالاتر).
ج) ایجاد ثبات در بازار (با کاهش نگرانیهای سرمایه گذاران)
د) ارزیابی خطر اعتباری طرفهای مقابل بانکها
هـ) تعیین حق العمل ریسک و نیز تعیین حدود پایه (Benchmark) برای خطر اعتباری.
موسسات رتبه بندی، برای تعیین رتبه شرکتهای ناشر اوراق بهادار و نیز اوراق بهادار و نیز اوراق قرضه عواملی همچون دورنمای صنعت، روندهای قانونی از نظر داخلی و بین المللی (استعداد کشور برای ملی کردن و تحولات مشابه، تحت عنوان مقررات محیطی یا وضع مالیات که می تواند اثر اجتناب ناپذیری بر گروههای همسان بر جای گذارد)، کیفیت مدیریت (جهت گیری و راهکارهای مدیریت در مقایسه با گروههای همسان، سابقه مدیریت در مواجهه با حوادث غیرمترقبه و فلسفه ریسک پذیری وی در رابطه با دارائیهایش، استراتژی موجود و خط مشی های مالی احتیاطی)، ساختار شرکت و اوراق بهاداری که منتشر می نماید، جایگزین های نقدینگی شرکت برای مقابله با کاهش احتمالی اعتماد بازار، موقعیت عملیاتی (ارزیابی عملکرد گذشته و پیش بینی های وضعیت آینده شرکت) و موقعیت مالی آنها را مورد ارزیابی قرار می دهند.
چنانچه در پیش نیاز اشاره شد موسسات رتبه بندی اعتباری در این امور از پیشینه تاریخی قابل ملاحظه ای (حداقل از سال 1910 میلادی) برخوردار هستند ولی بانکهای تجاری فقط زمان محدودی (حدود 10-5 سال) است که به این مقوله وارد شده و شرکتها را رتبه بندی
می نمایند.

چرا رتبه ها اهمیت دارند؟
طبقات رتبه بندی که با نمادهای مختلفی مثلاً AAA یا Aaa (برای عالی ترین کیفیت) یا با اعدادی مثلاً از 1 تا 10 مشخص می شوند شکل مختصر شده خطر اعتباری هستند. رتبه ها می توانند بر اساس اطلاعات گذشته به تواتر نسبی نکول مرتبط باشند یا می توانند مبنایی برای ارزش گذاری یک دارایی محسوب گردند.
شاخص ترین تقاضا برای رتبه ها در بخش مدیریت دارایی ـ بدهی شرکتی، زمانی است که بازده های سرمایه تعدیل شده بر حسب ریسک، معیار پایه برای ارزیابی عملکرد بخشی تلقی می شوند. رتبه ها برای بانک این امکان را فراهم می کنند که خطر اعتباری را اندازه گیری نموده و آن را متناسب با پرتقوی اعتباری اداره کنند و مفهوم اکسپوژر بانک را در رابطه با انواع خطر تعدیل و اصلاح نمایند. رتبه ها، مخصوصاً برای ارزش گذاری یک اوراق قرض و یا یک وام مفید هستند و رابطه ای مثبت ویژه بین خطر اعتباری مورد انتظار و بازده اسمی را بیان می کنند.
دلایل مذکور در فوق در مجموع بیانگر علت توجه طیف گسترده ای به کیفیت سیستم رتبه بندی یک موسسه مالی است. مثلاً شرکت های حسابرسی در ترازنامه ها، به سیستم های گزارش دهی ریسک موسسه توجه دارند. موسسات رتبه بندی نیز سیستم ارزیابی خطر یک وام گیرنده را که در نظر دارد اوراق بهادار با پشتوانه دارایی منتشر کند مورد بررسی قرار می دهند و در آینده نزدیک نیز انتظار می رود که مقامات نظارتی هم سیستم های رتبه بندی اساسی و مدلهای خطر اعتباری بانکها را مورد تایید قرار دهند.
1. چه تفاوتی بین رتبه های موسسات رتبه بندی (خارجی) و رتبه بندی داخلی وجود دارد؟
موسسات رتبه بندی رتبه های شرکتی و نیز وام گیرندگان کشوری را تعیین می کنند. از ویژگیهای این موسسات اینکه، هیچگونه مسئولیتی در رابطه با خطرهای موسساتی که رتبه آنها را تعیین می کنند نمی پذیرند. این موسسات رتبه بندی اطلاعات مربوط به رتبه بندی شرکتها را در سطح عموم منتشر می کنند ولی هیچگونه اطلاعاتی در خصوص فرآیند تعیین رتبه در اختیار هیچکس قرار نمی دهند.
در مقابل، رتبه بندی های داخلی که توسط واسطه های مالی (مشخصاً بانکها) به منظور ارزیابی خطراتی که دفاتر بانکها با آنها مواجه است انجام می گیرد و اطلاعات مربوط به رتبه مشتریان که توسط بانکها تعیین و نگهداری می شود یک مزیت رقابتی محسوب می گردد و بدلیل اینکه شامل اطلاعات خصوصی است، انتشار نمی یابد. به عنوان نمونه حتی شرکتی که رتبه آن تعیین می شود هیچ اطلاعی از رتبه جاری خود ندارد. البته این رتبه بندی در کشور ما در حال حاضر توسط هیچ یک از بانکهای تجاری انجام نمی شود. تفاوت دیگر این دو، رشد فزاینده اعتبار و قابلیت اعتماد به رتبه بندی موسسات خارجی است در حالی که هنوز انتشارات محدودی در مورد روش شناسی و تجارب رتبه بندی داخلی وجود دارد.
رتبه ها و خطر نکول
رتبه یک شرکت نمادی است که احتمال وقوع، نکول مورد انتظار به صورت عددی مجزا یا به شکل طبقات رتبه بندی نشان می دهد.
احتمال وقوع نکول یک متغیر پیوسته است که در محدوده صفر و یک تغییر می کند.
(1) [0،1] شرکتها: POD
احتمال وقوع نکول، تواتر نسبی مورد انتظار یک حادثه اعتباری است هنگامی که این حادثه به صورت عدم بازپرداخت اصل یا بهره سررسید شده (طی زمانی که حداقل 30 روز است) رخ می دهد و مقدار آن برابر یک خواهد بود. از این رو احتمال وقوع نکول یکی از اجزاء ضرر مورد انتظار وام دهنده است. ضرر مورد انتظار وام دهنده نیز از جمله متغیرهای دیگری است که در اعطاء تسهیلات توسط موسسات مالی اعتباری و بانکهای اعتباری مورد توجه قرار می گیرد. ضرر مورد انتظار برای یک مشتری با استفاده از رابطه زیر انجام می شود.
ضرر مورد انتظار حاصل از یک نکول مشخص × احتمال وقوع نکول = ضرر مورد انتظار
(2) E (LGD) × (EL) = POD
این انتظارات در یک فاصله زمانی مشترک، معمولاً یکسال آینده رخ می دهد. از این رو ضرر مورد انتظار، متوسط مبلغی است که یک وام دهنده انتظار دارد طی 12 ماه آینده از دست بدهد.
شکل (2-2) محاسبه زیان مورد انتظار را با این فرض که احتمال نکول 05/0 درصد است و بازیافتها با احتمال مساوی در فاصله بین 80-20 درصد تغییر می کنند نشان می دهد. تمامی ارزشها به صورت درصدی از وام واریز نشده در زمان وقوع نکول بیان می شود.

شکل (2-2) بیان گرافیکی محاسبه ضرر مورد انتظار با فرض استقلال بین احتمال نکول و شدت آن.
عبارت ریاضی (2) و شکل (2-2)، اساساً فرض می کنند که وقوع نکول و شدت یک نکول خاص مستقل از یکدیگر متغیرهای تصادفی را توزیع می کنند. به همین دلیل ضررها بین صفر و 100 درصد متغیر است (در مثال مورد نظر ما، ضرر بین صفر و 80 درصد متغیر است.) به بیان کلی تر کوواریانس غیر صفر احتمال وقوع نکول و احتمال وقوع یک نکول خاص را تایید می کند.
(3) E (L) = E (POD.LGD)
توزیع ضررها در حول ارزش مورد انتظار آنها یک معیار مهم از ریسک کلی بازار است. خطر ضرر غیر منتظره، تعداد انحراف معیارهای یک چندک مشخص (99%) از ارزش مورد انتظار آن است. ضرر غیر منتظره با ابزارهای اخیر و خطر کلی بازار مشخص می گردد.
هر چند از نظر تئوری، احتمالهای وقوع نکول به صورت طبقات گروههای مختلف رتبه نمایش داده می شود ولی در عمل طور دیگری است. طبقات رتبه بندی بر اساس اطلاعات تاریخی با احتمال وقوع خطر نمایش داده می شوند. موسسات رتبه بندی فعلی اغلب از نرخهای تاریخی نکول برای طراحی مدلهای خود استفاده می کنند. نرخ های نکول درصدی از تمام اوراق قرضه منتشره واریز نشده در زمان t هستند که در فاصله زمان t (با فرض t دوزاده ماه) با یک حادثه اعتباری مواجه می شوند. اقلاً، هیچگونه رابطه ساده (خطی یا لگاریتم خطی) بین درجات ترتیبی رتبه با احتمال های اصلی وقوع نکول وجود ندارد. بررسیهای تجربی که از مطالعات S&P و مودیز اخذ شده یک رابطه استثنایی بین احتمال وقوع نکول و درجه رتبه بندی بدست آورده است. آنچه در اینجا مدنظر است تمرکز بر احتمال های وقوع نکول به عنوان هدف سیستم های رتبه بندی است. مشتری نمونه در این مطالعات شرکتها و بنگاهها هستند و یک وام گیرنده یا ابزار مالی منفرد، مثلاً معاملاتی که پشتوانه آنها یک دارایی است، نمی باشند. برای اینکه بتوان احتمال وقوع یک نکول خاص را بررسی کرد لازم است مجموعه ای متمایز از اصول، مدنظر قرار داده شود. از نقطه نظر تمایز بین احتمال وقوع نکول و احتمال وقوع یک نکول و نیز روشن کردن هدف سیستم های رتبه بندی می بایست هم سوی با نقطه نظرات ارائه شده در کمیته نظارتی بال حرکت کرد.
مدلهای رتبه بندی
روشهای متفاوتی وجود دارند که از طریق آنها می توان یک رتبه بدست آورد. از آن جمله می توان به اندازه گیری احتمال وقوع نکول اشاره کرد. روش مشخصی که امروزه کاربرد دارد، روش امتیازدهی است. این روش متکی به مجموعه ای از معیارهاست که هر یک به خوبی تعریف شده اند. به هر یک از معیارها بطور جداگانه امتیاز داده می شود. به هر امتیاز که به مجموعه ای از معیارها مرتبط است وزنی داده می شود، سپس اینها با هم جمع می شوند. حاصل جمع، یک امتیاز کلی است.
این امتیاز به یکی از طبقات رتبه تبدیل می گردد که در حد فاصل بین حداقل امتیاز کلی تا حداکثر آن قرار می گیرد. مثال واضح در این مورد Z-Score پیشنهاد شده توسط آلتمن در سال 1968 است. این نویسنده پیشنهاد کرده است که رابطه بین تجربه تاریخی نکول و تعدادی از متغیرهای حسابداری (عمدتاً ترازنامه و صورت سود و زیان) بررسی شود تا یک تابع مطلوب مجزا بین ناشرینی که در آینده مرتکب نکول خواهند شد و نیز آنها که همچنان به فعالیت خود ادامه خواهند داد، تعیین شود. اوزان تابع تخمین زده شده برای پیش بینی احتمال نکول هر شرکت قابل استفاده است و این اوزان که Z-Score نامیده شده اند می توانند به یک درجه از رتبه تبدیل شوند. بدنبال آن وی روشهای رتبه بندی مشتریان را در سال 1980 مطرح نمود. مدل ریاضی دیگری که باز در همین زمینه مطرح گردید مربوط به کاربرد تحلیل ممیزی در طبقه بندی شرکتها می باشد.
یک روش متفاوت برای رتبه بندی توسط مدل عمومی شرکیت KMV's تشریح شده است. این روش بر اساس تئوری قیمت گذاری آپشن KMV استنتاج شده است. در این روش برآورد نکول از نوسانات مورد انتظار قیمت های سهام در طول یک مدت مشخص مثلاً یکسال، قابل استنتاج است. در این روش برخلاف روش امتیازدهی نیازی نیست که اطلاعات مختلفی در مورد یک شرکت جمع آوری کرد. در این روش صرفاً سریهای زمانی قیمت های بازاری سهام و تخمین بدهکاری یک بنگاه، مورد نیاز است.
بررسی انجام شده در مورد بانکهای عمده آلمان، بیانگر این است که کلیه موسسات، روش امتیازدهی را اعمال می نمایند.
اختلافی که در موسسات رتبه بندی مشاهده می شود به گزینش معیارهای آنها، بویژه اهمیت زیادی که آنها به (Soft Factors) یا عوامل کیفی می دهند، باز می گردد. این عوامل شامل ارزیابی کیفیت مدیریت یا پیش بینی کلی دورنمای شرکت در بازار است. جدول (2-1) نشان می دهد که سیستم های رتبه بندی داخلی و خارجی متکی به مجموعه ای از متغیرهای توضیحی هستند. تعداد طبقات رتبه بندی استاندارد اندپور (S&P) و مودیز هر یک 22 درجه (غیر از Watch list) است. حال آنکه در سیستمهای رتبه بندی بانکهای تجاری تعداد درجات رتبه کمتر است (مثلاً حدود 10-6). هر چند در این مورد که کلیت فرآیندی که بر اساس آن موسسات رتبه بندی، رتبه نهایی خود را از معیارهای مورد اشاره استخراج می نمایند، مشخص نیست ولی ما فرض را بر این قرار می دهیم که شروط پذیرفته شده برای رتبه بندی می تواند برای موسسات رتبه بندی و مدلهای رتبه بندی داخلی بطور یکسان اعمال گردد. نمونه معیارهای مورد استفاده برای رتبه بندی مشتریان توسط موسسات معتبر و یک بانک آلمانی بطور مختصر در جدول زیر آورده شده است.
جدول 2-1 معیارهای رتبه بندی بانکها و موسسات رتبه بندی
اصول مدیریت ریسک اعتباری
هدف مدیریت ریسک اعتباری ماکزیمم کردن بازده اصلاح شده بر اساس ریسک از طریق حفظ میزان قابل قبول ریسک اعتباری بانک است. بانکها باید ریسک اعتباری ذاتی کل پورتفوی و همچنین ریسک اعتبارات جداگانه و یا معاملات را مدیریت کنند. بانکها باید ارتباطات بین ریسک اعتباری و سایر ریسکها را هم مدنظر قرار دهند. مدیریت موثر ریسک اعتباری یکی از اجزای حیاتی روند فراگیر اداره ریسک و عامل اساسی موفقیت بلند مدت هر موسسه بانکی است.
برای اکثر بانکها، وام ها بزرگترین و بدیهی ترین منبع ریسک اعتباری می باشند، البته منابع دیگر ریسک اعتباری هم در فعالیتهای بانکها وجود دارد که شامل عملیات بانکی و یا اجاری بوده و می تواند هم مربوط به اقلام ترازنامه ای و هم اقلام زیر خط (خارج از ترازنامه) باشد. بانکها بطور فزاینده ای با ریسک اعتباری و با ریسک طرفهای معامله در انواع ابزارهای مالی به غیر از وام ها مواجه هستند. از جمله این ابزارها: قبولی های بانکی، معاملات بین بانکی، تامین فعالیت های تجاری، مبادلات ارزی، تامین مالی آتی، معاملات تعویضی اوراق قرضه، اوراق سهام، آپشن ها و فراتر در زمینه تعهدات و ضمانتنامه ها و تسویه معاملات می باشند. از آن جهت که میزان ارزش در معرض ریسک اعتباری، یکی از منابع ارجح مسایل بانکهای جهان می باشد، بانکها و ناظران آنها باید قادر باشند که از تجارب گذشته درس های مفیدی را بدست آورند. بانکها باید آگاهی هوشمندانه ای از نیازهای مربوط به شناسایی، محاسبه و نظارت و کنترل ریسک اعتباری و همچنین میزان سرمایه مورد نیاز برای مواجهه با ریسکهای مزبور و قابلیت جبران ریسکها را دارا باشند. از این رو می بایست توانایی ارزیابی مدیریت ریسک اعتباری را داشته باشند.
اصول مربوط به ارزیابی مدیریت ریسک اعتباری
ارزیابی مدیریت ریسک اعتباری به منظور دستیابی به اهداف از پیش تعیین شده نیازمند یک سیستم کارآمد می باشد که زمینه لازم را برای اجرای مطلوب آن فراهم می آورد. در طراحی این سیستم ابعاد زیر می بایست مورد توجه قرار گیرد:
الف) ایجاد محیط مناسب برای مدیریت ریسک
ب) انجام فعالیتهای مربوط به فرآیند اعطای اعتبار بدون نقص
پ) حفظ ضوابط اجرایی مناسب برای اعتبارات، همچنین روند محاسبات و نظارت
ت) حصول اطمینان از کنترل بر ریسک اعتباری
ایجاد محیط مناسب برای مدیریت ریسک
1. هیات مدیره بانک مسئولیت دارد که به صورت دوره ای ـ حداقل به طور سالانه راهبردهای ریسک اعتباری و سیاستهای عمده ریسک اعتباری را مورد بازنگری قرار دهد. راهبردها باید انعکاس دهنده انعطاف پذیری بانک در زمینه تغییرات سطوح ریسک و سودآوری باشد که بانک برای ریسکهای مختلف اعتباری انتظار دارد.
2. مدیریت ارشد مسئولیت کاربرد راهبردهای ریسک اعتباری را که توسط هیات مدیره تصویب شده است بر عهده دارد. از سوی دیگر، مدیریت ارشد مسئول سیاستهای توسعه ای و روشهای تشخیص، محاسبه و نظارت و کنترل ریسک اعتباری نیز می باشد. این سیاستها و روندها باید ریسک اعتباری را در تمام فعالیتهای بانک و در سطوح مختلف اعتبارات فردی و نیز پرتفوی اعتبارات بانک در مد نظر قرار دهند.
3. بانکها باید ریسک اعتباری موجود در تمام تولیدات و فعالیتهای خود را مورد شناسایی قرار دهند. همچنین بانکها باید اطمینان حاصل کنند که مدیریت ریسک اعتباری در مورد خدمات و فعالیتهای جدید، از طریق روشهایی که بطور مقتضی توسط هیات مدیره و یا کمیته مربوط تصویب می شود اعمال شده باشد.
انجام فعالیتهای مربوط به فرآیند اعطای اعتبار بدون نقص
1. بانکها باید تحت شرایط و ضوابط اعطای اعتباری که به خوبی تعریف شده و از سلامت و صحت لازم برخوردار می باشد، فعالیت کنند. این شرایط و ضوابط باید بطور شفاف نشان دهنده اهداف بانک در بازار و گویایی آن باشند. درک صحیح از وضعیت وام گیرندگان و یا طرف های تجاری و همچنین هدف و ساختار اعتبار اعطایی و نیز منابع بازپرداخت آن الزامات این شفاف سازی می باشد. این امر با طراحی نظام تعیین درجه اعتباری برای دریافت کنندگان تسهیلات میسر خواهد بود.
2. بایستی محدودیت ها و سقف های اعتباری برای افراد، وام گیرندگان و طرفهای تجاری و گروههای تجاری بهم وابسته تعیین گردد. این امر باید خطرهای مختلف را به شکل قابل مقایسه و معنی داری چه در سطح حسابهای ترازنامه ای بانک و چه در حسابهای زیر خط (خارج از ترازنامه) بطور یکجا در نظر بگیرد.
3. اعطای اعتبارات باید به گونه ای آزاد و مستقل صورت گیرد، خصوصاً در زمینه اعطای اعتبارات به شرکتها و افراد وابسته ای که بر اساس استثناهای خاصی صورت می گیرد، لازم است که احتیاط ها و نظارتهای خاصی اعمال شود و راهکارهای مناسبی برای کنترل و تخفیف ریسک مربوط به اعطای این نوع اعتبارات که بطور غیر مستقل صورت می گیرند در نظر گرفته شود.
حفظ ضوابط اجرایی مناسب برای اعتبارات، همچنین روند محاسبات و نظارت
1. بانکها باید دارای سیستمی به منظور مدیریت انواع پورتفوهای دارای ریسک اعتباری باشند.
2. باید سیستمی برای نظارت بر شرایط هر یک از اعتبارات از جمله تعیین کفایت ذخایر و اندوخته ها طراحی شود.
3. تسهیلات لازم برای تصمیم های داخلی در رابطه با درجه بندی ریسک اعتباری در سیستم مدیریت ریسک اعتباری توسعه و گسترش یابد. سیستم های درجه بندی باید با طبیعت، اندازه و میزان پیچیدگی فعالیتهای بانک تطابق داشته باشد.
4. باید از تصمیم های اطلاعاتی و تکنیک های تحلیلی سود جست بطوریکه محاسبه ریسک اعتباری فعالیتهای ترازنامه ای و یا خارج از ترازنامه برای مدیریت بانک امکان پذیر گردد و سیستم اطلاعات مدیریت باید اطلاعات لازم را در رابطه با ترکیب پرتفوی اعتباری و نیز هر گونه ریسک متمرکز تامین نماید.
5. تصمیمی به منظور نظارت بر ترکیب کلی و کیفیت پرتفوی اعتباری طراحی گردد.
6. در زمان اندازه گیری میزان و کیفیت اعتبارات افراد و یا پورتفوی اعتباری آنها، تغییرات بالقوه در شرایط اقتصادی آینده در نظر گرفته شود و نیز خطرهای ریسک اعتباری برای شرایط مخاطره آمیز اندازه گیری شود.
حصول اطمینان از کنترل بر ریسک اعتباری
1. باید سیستم های بی طرفی برای بررسی فعالیت های مدیریت ریسک اعتباری برقرار شود و نتیجه بررسی های این سیستم باید مستقیماً به اطلاع هیات مدیره و مدیریت ارشد برسد.
2. باید این اطمینان حاصل گردد که عملیات اعطای اعتبار بخوبی مدیریت شده و خطرهای ریسک اعتباری سطوح مختلف آن منطبق با استانداردها و محدودیت های داخلی بانک می باشد. بانکها باید کنترلهای داخلی قوی را نیز اعمال نمایند و همچنین تمهیدات لازم به منظور گزارش روزآمد موارد استثنا در زمینه سیاستها، فرآیندها و یا محدودیتهای اعتباری به سطوح مدیریتی مربوطه را فراهم آورند.
3. سیستمی به منظور انجام فعالیتهای مربوط به اصلاح و بهبود لازم در رابطه با نوسانات اعتباری در مراحل اولیه وقوع آن و نیز اداره مشکلات مدیریتی و یا شرایط مشابه طراحی گردد. کلیه تمهیدات فوق در صورتی از اثربخشی لازم برخوردار خواهد بود که سیستم پشتیبانی مناسبی طراحی و تدوین گردد بگونه ای که پس از اخذ معیارهای مربوط به هر یک از مشتریان ریسک اعتباری مربوط به آنها را محاسبه نماید. از طرف دیگر می بایست علاوه بر ریسک اعتباری مربوط به هر یک از مشتریان ظرفیت اعتباری آنها نیز مورد توجه قرار گیرد. با توجه به اینکه تمرکز این رساله بر سنجش ریسک و ظرفیت اعتباری مشتریان بطور همزمان می باشد در این رساله برای این منظور از شبکه های عصبی و رگرسیون خطی و لجستیک استفاده شده است.
از آنجاییکه رویکرد شبکه های عصبی بهمراه مدل رگرسیون لجستیک برای اولین بار بمنظور دستیابی به این هدف در رساله های دکتری مدیریت استفاده شده است، بخش دوم این فصل بطور مفصل به تشریح این دو رویکرد می پردازد.
همچنانکه در شکل فوق ملاحظه می کنید این تابع پیوسته و صعودی یکنوا می باشد، بعلاوه در تمام نقاط قابل مشتق گیری می باشد، از اینرو همواره امکان اعمال الگوریتم یادگیری جستجوی گرادیان برای شبکه های چند لایه با استفاده از این تابع میسر است. از طرف دیگر این الگو برای مسایل شناخت الگو بسیار مناسب می باشد، زیرا خروجی بین [0،1] را می توان به عنوان تخمین احتمال تفسیر نمود.
در مسائلی که نیاز به جداکننده غیر خطی فضای الگو وجود دارند، با استفاده از شبکه های عصبی 2 لایه امکان جداسازی فضای الگو با هر نوع مرز تصمیم گیری دلخواهی را می توان بدست آورد.
با این حال این نتیجه بدین معنی نیست که شبکه های بیشتر از 2 لایه مزیتی ندارند. برای بعضی از مسایل یک شبکه 3 لایه کوچک می تواند بجای یک شبکه 2 لایه (که مجبور به داشتن بی نهایت گره است) بکار رود.
کاربرد شبکه های عصبی در برآورد ریسک اعتباری
منظور از ریسک اعتباری همان احتمال عدم برگشت اصل وام اعطایی از سوی مشتریان می باشد. در این زمینه باید گفت که در برخی از موارد دریافت کنندگان وام توان ارزیابی منافع حاصل از سرمایه گذاری خود را نداشته و در نهایت امر متضرر شده و به تبع آن نمی توانند تسهیلات دریافتی را پرداخت نمایند. در مورد ظرفیت اعتباری ـ نیازهای واقعی افراد برای دریافت وام ـ نیز در غالب موارد میزان تسهیلات دریافتی توسط دریافت کنندگان تسهیلات، انطباق لازم را با ظرفیت اعتباری آنها ندارد. امروزه در غالب بانکهای تجاری جهان و همچنین در کلیه بانکهای تجاری کشور اغلب از روش قضاوتی برای تعیین ریسک و ظرفیت اعتباری مشتریان استفاده می شود؛ لیکن استفاده از این روش با توجه به توان محدود انسان در تحلیل همزمان فاکتورهای مختلف موثر بر ریسک و ظرفیت اعتباری دریاف کنندگان اعتبار روش قضاوتی در مقایسه با روش های آماری و همچنین روش های هوش مصنوعی از کارایی کمتری برخوردار است. در همین راستا در طی چند سال اخیر مدلهای شبکه های عصبی جایگاه ویژه ای را در بازارهای مالی، ارزیابی داراییهای منقول و حتی در مراقبتهای بهداشتی به خود اختصاص داده است که از جمله مهمترین آنها می توان به مطالعات لویی در استفاده از این مدلها در بازار مالی، ارزیابی داراییهای واقعی، تشخیص انحطاط مالی شرکتها اشاره نمود. هر چند برای این منظور از مدلهای کلاسیک نیز استفاده می شود. لیکن مدلهای شبکه عصبی در مقایسه با برخی از مدلهای کلاسیک مانند تحلیل ممیزی از اهمیت ویژه ای در برآورد و تخمین برخوردار هستند. این مدلها را می توان به نوعی تعمیمی از مدلهای رگرسیون غیر خطی به شمار آورد. از این رو به کارگیری این مدلها از سوی محققین برای تشخیص روندها، الگوها در داده ها و همچنین تولید دانش از داده ها به صورت گسترده ای فراگیر شده است.
انعطاف پذیری فوق العاده این مدلها نیز از عوامل دیگری است که سبب به کارگیری آن در تمام زمینه های دانش بصورت فراگیر شده است یکی از کاربردهای مدلهای شبکه های عصبی پیش بینی و تخمین یک متغیر ویژه با استناد به تعدادی ورودی می باشد. بدین معنی که مدل های شبکه های عصبی با استفاده از یک سری داده های ورودی؛ داده خروجی را با استفاده از یک فرآیند مشخص پیش بینی می کنند از این رو مدلهای شبکه عصبی یک سری داده های ورودی و خروجی را گرفته و رابطه بین متغیرهای ورودی و خروجی را مشابه مدلهای رگرسیون غیر خطی تخمین می زنند. در این مدل کل داده های مدل به دو گروه آموزش 1 و آزمایش 2 تقسیم می شوند؛ سپس داده های آزمایش از مدل حذف شده با استفاده از داده های آموزشی مدل مورد نظر برازش می گردد. پس از برازش مدل از داده های آزمایشی برای تست مدل استفاده می شود که غالباً حدود 10 تا 20 درصد از کل داده ها را به عنوان داده های آزمایش تعریف می کنند.
هر چند در برخی از مدلهای شبکه عصبی حجم داده ها تا 25% از کل داده ها نیز می رسد. باید توجه داشت که در مدلهای سری زمانی داده های آزمایش می بایست از داده های اخیر انتخاب شود ولی در مدلهای معمولی انتخاب داده های آزمایش بصورت تصادفی می باشد. هدف اساسی از داده های آزمایش آن است که با استفاده از آن بتوان نتایج پیش بینی شده از طریق مدل را برای داده های آزمایشی با جواب واقعی آنها مقایسه نمود. بدیهی است اختلاف بین متغیر وابسته پیش بینی شده از طریق مدل و مقدار واقعی آن در داده های آزمایشی نشان دهنده مقدار خطا خواهد بود که با استفاده از متوسط قدر مطلق خطا یا مجموع مربعات خطا نشان داده می شود، مجموعه داده های آزمایشی را در برخی موارد تحت عنوان مجموعه داده های تولید، نیز می نامند. حال به منظور بررسی اهمیت مدلهای شبکه عصبی در مقایسه با مدلهای کلاسیک به تشریح این مدلها می پردازیم.
شبکه های عصبی
یکی از جنبه های تمرکز اصلی پژوهش ارزیابی مدل شبکه های عصبی در مقایسه با مدلهای کلاسیک می باشد. مدل شبکه های عصبی با توجه به ویژیگهای خاصی که دارد در مقایسه با مدلهای کلاسیک از اهمیت بالاتری برخوردار است. این شبکه ها با استفاده از فرایند یادگیری رابطه منطقی تری را بین متغیرهای ورودی و خروجی ایجاد می کند که به نوبه خود در دستیابی به مدلی با دقت بیشتر در برآورد متغیرهای وابسته موثر است. بنابراین از این مدل در این تحقیق به منظور برآورد همزمان ریسک اعتباری و ظرفیت اعتباری استفاده گردید. در این زمینه توضیح این مطلب ضروری است که شبکه های عصبی با توجه به قابلیت پردازش همزمان و سایر ویژیگیهای منحصر به فرد توان ارزیابی همزمان دو متغیر از نوع متفاوت (به عنوان مثلا ریسک اعتباری از نوع باینری و ظرفیت اعتباری به عنوان متغیر پیوسته) را دارا می باشد از این رو در این پژوهش از این مدل استفاده شده است. نکته حائز اهمیتی که شبکه های عصبی از مدلهای کلاسیک متمایز می سازد فرایند یادگیری این مدل است که در فصل قبل بصورت تفصیلی تشریح گردید.
ریسک اعتباری
آنچه که مسلم است آنست که در ادبیات مدیریت مالی تعاریف متعددی از ریسک گردیده است که هر کدام در جایگاه خود از اهمیت ویژه ای برخوردار هستند. لیکن در این پژوهش تمرکز اصلی بر ریسک اعتباری می باشد، ریسک اعتباری در موسسات مالی ـ که فعالیت اصلی آنها تامین منابع مالی مورد نیاز برای سرمایه گذاری می باشد ـ دارای اهمیت ویژه ای است. ریسک اعتباری برای موسسات مالی و بانکها اغلب مفهوم یکسانی دارد. توانایی بازپرداخت تسهیلات دریافتی توسط دریافت کننده تسهیلات در موعد سررسید به بانکها و موسسات مالی مفهوم مشترک ریسک اعتباری از دیدگاه آنها را نمایش می دهد. بانکها و موسسات مالی برای اطمینان از بازپرداخت تسهیلات اغلب اقدامات خاصی را انجام می دهند. بدین منظور در بیشتر سیستمهای مالی از فنون اولویت بندی مشتریان استفاده می شود. مشتریانی که از اولویت بالاتری برخوردار باشند، از دیدگاه بانکها و موسسات مالی وضعیت مساعدتری برای دریافت تسهیلات خواهند داشت. تکنیکها غالباً کیفی بوده و در صورت استفاده از فنون کمی از اعتبار نسبتاً ضعیفی برخوردار می باشد از این رو کمتر بصورت ابزار کنترلی در عمل مورد استفاده قرار می گیرد.
ظرفیت اعتباری
یکی از فاکتورهای اساسی که اغلب بانکها در تخصیص اعتبار به مشتریان با آن مواجه هستند آن است که ظرفیت اعتباری هر یک از مشتریان را تعیین کنند. بدیهی است که تعیین ظرفیت اعتباری مشتریان بر اساس یک الگوی صحیح می تواند در تخصیص کارآمد اعتبار نقش اساسی ایفاء نماید.
در مدل بررسی در این پژوهش ظرفیت اعتباری مشتریان به عنوان یکی از موارد حائز اهمیت در تخصیص اعتبار به مشتریان مورد توجه قرار گرفت. بدین معنی که قبل از اعطاء تسهیلات به مشتریان می بایست ظرفیت اعتباری آنها نیز مورد توجه قرار گیرد و متناسب با آن در تخصیص اعتبار به مشتریان اقدام شود.
3-1-6- برآورد ریسک و ظرفیت اعتباری با استفاده از
شبکه های عصبی و مدل رگرسیون
سیستم های بانکی در هر کشور یکی از مهمترین عوامل موثر بر رشد اقتصادی کشور محسوب می شود. نکته حائز اهمیت آنست که چگونه این سیستم می تواند به نحو مطلوبی عمل نموده و توسعه اقتصادی را در یک کشور فراهم آورد. در پاسخ به این سوال باید گفت که کارکرد صحیح این سیستم منوط به استفاده صحیح از منابع جمع آوری شده می باشد. در صورتی که سیستم بانکی بتواند منابع جمع آوری شده را به نحو مطلوبی تخصیص دهد، قطعاً وظیفه اصلی خود را که کمک به رشد و توسعه اقتصادی است به نحو مطلوب انجام داده است. در این زمینه باید گفت که زمانی سیستم بانکی خواهد توانست به این وظیفه خود جامه عمل بپوشاند که منابع جمع آوری شده را به نحو مطلوبی در جهت رشد و توسعه اقتصادی بکار گیرد و این امر مستلزم بررسی و ارزیابی صحیح دریافت کنندگان تسهیلات می باشد.
از دیگر سوی آنچه حائز بیشترین اهمیت است اینست که اگر بانکها بتوانند منابع جمع آوری شده را به نحو مطلوبی به دریافت کنندگان تسهیلات اعطاء نمایند، نتیجه حاصل موجب برگشت صحیح منابع گشته و به تبع آن موفقیت بانک را در کوتاه مدت و بلند مدت تضمین خواهد کرد. بنابراین ارزیابی صحیح دریافت کنندگان تسهیلات به صورت یک فرآیند دو سویه علاوه بر اثر غیرقابل انکار بر رشد و توسعه اقتصادی در موفقیت بانکها نیز موثر است. ارزیابی صحیح مشتریان نیز در پاسخ به دو سوال اساسی نهفته است.
1) ریسک اعتباری مربوط به هر یک از دریافت کنندگان وام چقدر است؟
2) ظرفیت اعتباری هر یک از دریافت کنندگان وام چقدر است؟
امروزه در غالب بانکهای تجاری جهان و همچنین در کلیه بانکهای تجاری کشور اغلب از روش قضاوتی برای تعیین ریسک و ظرفیت اعتباری مشتریان استفاده می شود، لیکن استفاده از این روش با توجه به توان محدود انسان در تحلیل همزمان فاکتورهای مختلف موثر بر ریسک و ظرفیت اعتباری دریافت کنندگان اعتبار در مقایسه با روشهای آماری و همچنین روش های هوش مصنوعی از کارائی کمتری برخوردار است. در همین راستا در طی چند سال اخیر مدلهای شبکه های عصبی جایگاه ویژه ای را در بازارهای مالی، ارزیابی دارائیهای منقول و حتی در مراقبتهای بهداشتی به خود اختصاص داده است که از جمله آنها می توان به مطالعات لویی در بازار مالی ، ورزیلا در ارزیابی دارائیهای واقعی ، آلتمن در زمینه تشخیص انحطاط مالی شرکتها اشاره نمود. لیکن مدلهای شبکه عصبی در مقایسه با برخی از مدلهای کلاسیک مانند تحلیل ممیزی از اهمیت ویژه ای دربرآورد و تخمین برخوردار هستند. این مدلها را می توان به نوعی تعمیمی از مدلهای رگرسیون غیرخطی به شمار آورد. از این رو به کارگیری این مدلها از سوی محققین برای تشخیص روندها و الگوها در داده ها و همچنین تولید دانش از داده ها به صورت گسترده ای فراگیر شده است.
انعطاف پذیری فوق العاده این مدلها نیز از عوامل دیگری است که سبب به کارگیری آن در تمام زمینه های دانش بصورت فراگیر شده است.
یکی از کاربردهای عمده مدلهای شبکه های عصبی پیش بینی و تخمین یک متغیر ویژه با استناد به تعدادی ورودی می باشد. بدین معنی که مدل های شبکه های عصبی با استفاده از یک سری داده های ورودی، داده خروجی را با استفاده از یک فرآیند مشخص پیش بینی می کنند. مدلهای شبکه عصبی یک سری داده های ورودی و خروجی را گرفته و رابطه بین متغیرهای ورودی و خروجی را مشابه مدلهای رگرسییون غیرخطی تخمین می زنند. در این مدل کل داده های مدل به دو گروه آموزش و آزمایش تقسیم می شوند و پس از آن کل داده های آزمایش از مدل حذف شده با استفاده از داده های آموزشی مدل مورد نظر برازش می گردد. پس از برازش مدل از داده های آزمایشی برای تست مدل استفاده می شود، غالباً حدود 10 تا 20 درصد از کل داده ها را به عنوان داده های آزمایش تعریف می کنند. هر چند در برخی از مدلهای شبکه عصبی حجم داده ها تا 25% از کل داده ها نیز می رسد . هدف اساسی از داده های آزمایش آن است که با استفاده از آن بتوان نتایج پیش بینی شده از طریق مدل را برای داده های آزمایشی با جواب واقعی آنها مقایسه نمود. بدیهی است اختلاف بین متغیر وابسته پیش بینی شده از طریق مدل و مقدار واقعی آن در داده های آزمایشی نشان دهنده مقدار خطا خواهد بود که با استفاده از متوسط قدر مطلق خطا یا مجموع مربعات خطا نشان داده می شود مجموعه داده های آزمایشی را در برخی موارد تحت عنوان مجموعه داده های تولید نیز می نامند شکل زیر یکی مدل های معروف شبکه عصبی را که پرسپترون چند لایه نامیده می شود نشان می دهد.
همچنانکه ملاحظه می شود این شبکه دارای یک لایه ورودی، یک لایه خروجی و یک لایه پنهان می باشد در این مدل x1, x2 برادر ورودی y2 , y1 بردار خروجی شبکه را نشان می دهد، بنابراین این شبکه عصبی دارای 2 متغیر ورودی و دو متغیر خروجی می باشد و wijk نیز در مدل فوق وزن متغیر j ام به نرون kام در لایه I ام را نشان
می دهد.
بجز لایه ورودی هر کدام از نرونهای لایه پنهان در مدل فوق تابع تبدیل مربوط به نرون مربوطه را نشان می دهد. بنابراین خروجی یکی از لایه های نرون پنهان به عنوان مثال بصورت زیر خواهد بود.

با داشتن مقدار تابع لایه پنهان مقدار لایه خروجی (Output) بصورت زیر تعریف خواهد شد.

آنچه که در یک مدل شبکه عصبی حائز اهمیت است آنست که وزنهای موجود در شبکه عصبی به نحو مطلوبی برآورد شوند. بدیهی است پس از تعیین وزنها به نحو مطلوب با دادن بردار متغیرهای ورودی به سهولت می توان مقادیر بردار خروجی را برآورد نمود. تعیین وزنها در شبکه عصبی از یک الگوریتم کارآمد پیروی کند با توجه به تمرکز پژوهش بر مدار شبکه های عصبی در اینجا بطور مختصر الگوریتم یادگیری تشریح می شود.
الگوریتم یادگیری در شبکه های عصبی
به منظور برآورد مقادیر مطلوب بردار وزنها از روشهای متعددی استفاده می شود که مهمترین و پرکاربردترین آنها که اغلب در شبکه های عصبی پرستپرون چند لایه مورد استفاده قرار می گیرد، الگوریتم پس انتشار خطا می باشد. در این روش همچنان که از عنوان آن بر می آید، مقدار خطا مجدداً به مدل شبکه های عصبی منتقل و مقادیر وزنها را تعدیل می نماید.
با عطف توجه به موارد فوق معادله مربوط به تعدیل وزنها را می توان تعریف نمود. بدین منظور فرض نمایید نشان دهنده ورودی نرون j ام در لایه s و نشان دهنده مجموع موزون ورودی نرون i ام در لایه s و میزان خطای محلی نرون k ام در لایه s باشد در این صورت معادله بردار تغییر وزن بصورت زیر در می آید.
(1)
و برای لایه بدون خروجی تابع یادگیری بصورت زیر خواهد بود:
(2)
برای لایه خروجی نشانگر ضریب یادگیری و بیانگر تکان لحظه ای است. استفاده از روابط (1) و (2) برای تعدیل وزنها بستگی به نوع شبکه دارد، با توجه به اینکه در طبقه بندی شبکه های عصبی آنها را به دو گروه شبکه های عصبی بدون ناظر و با ناظر تقسیم می کنند، زمانی که هم متغیر ورودی و هم متغیر خروجی برای مدل مشخص باشد، در آنصورت مدل مربوط به سهولت می تواند مقادیر خطا را تعیین و به تبع آن بردار وزنهای مدل را بهبود بخشد بعنوان مثال در این زمینه می توان به مدل رگرسیون تعمیم یافته شبکه های عصبی اشاره نمود برخی مواقع نیز مقادیر بردار ورودی مدل کاملاً مشخص می باشد لیکن بردار خروجی مدل در دست نیست.
به عنوان مثال داده های مربوط به دسته بندی و بهینه سازی را در مدلهای خطی و غیر خطی می توان در این طبقه جای دارد در یک مدل بهینه سازی مقدار جواب بهینه در دسترسی نمی باشد. لیکن مقادیر بهبود در هر تکرار دقیقاً قابل بررسی و ارزیابی می باشد، بدین معنی که پس از هر تکرار در صورتی که جواب مدل بهبود یابد، این امر بدان معنی خواهد بود که مدل به سمت جواب بهینه حرکت می کند.
بنابراین حلقه یادگیری تا دستیابی به بردار وزن مطلوب ادامه خواهد یافت. از جمله راههایی که می تواند از توقف شبکه های عصبی در نقاط حداقل محلی جلوگیری کند استفاده از داده های آموزشی تصادفی است و انتخاب مقدار مطلوب بعنوان نرخ یادگیری می باشد. انتخاب نرخ یادگیری پایین سرعت یادگیری را پایین می آورد لیکن از طرف دیگر انتخاب نرخ یادگیری بزرگ ممکن است موجب واگرایی مدل گردد. هر چند انتخاب ضریب یادگیری کوچک برای یادگیری موجب از بین رفتن نوسانات خواهد شد ولی در برخی موارد نیز نرخ یادگیری را بزرگ انتخاب می کنند، لیکن مقدار آن بتدریج کاهش می یابد تا اینکه مدل همگرا گردد.
آنچه که در تمام فرآیندهای تکراری حائز اهمیت است آنست که تکرار الگوریتم می بایست تا چه زمانی ادامه یابد در این مورد باید گفت که سه راه برای توقف الگوریتم وجود دارد.
1. توقف پس از چند تکرار مشخص
2. کاهش میزان خطا تا یک حد معین
3. بوجود آمدن ثبات در شبکه عصبی، بدین معنی که اگر پس از چند تکرار متوالی هیچ بهبودی در شبکه عصبی مشاهده نگردد.
اندازه شبکه عصبی
سئوالات اساسی که همواره در طراحی شبکه های عصبی مطرح است آنست که اولاً تعداد نرونهای (پردازشگرهای) مورد نیاز در یک شبکه معین می بایست چقدر باشد، ثانیاً با فرض اینکه تعداد نرونها مشخص باشد تعداد لایه پنهان را چگونه می توان تعیین نمود؟
در مورد سئوالات مطروحه فوق هیچ جواب صریحی تا بحال ارائه نشده است. در سال 1986 یک روش آماری برای انتخاب اندازه شبکه و تعداد نرونها تحت عنوان نگرش ممیزی پیشنهاد گردید لیکن در نهایت یک مدل الگوی عملیاتی در این زمینه ارائه نکرد. در سال 1993 نیز یک سری دستورالعملها ارائه گردید که معیارهای برازش را بهینه می نمود در اینجا نیز از همان دستورالعمل های آماری استفاده می شد، این دستورالعملها نیز در سال 1996 به شدت از سوی محققین رد گردید. از آن زمان تا به حال نیز در مورد توپولوژی شبکه های عصبی تکنیکهای متعددی ارائه شده است که هیچ کدام از آنها دارای جامعیت لازم نمی باشد. از اینرو تا به حال در اغلب مدلهای شبکه های عصبی استفاده شده برای انتخاب تعداد نرونها (پردازشگرها) و همچنین تعداد لایه های پنهان از روشهای ابداعی استفاده گردیده است.
مبنای استفاده از نرونها بر این اصل استوار است که هر اندازه تعداد نرونها افزایش یابد انعطاف شبکه بیشتر خواهد شد. لیکن انعطاف بیشتر در یک مدل شبکه عصبی مصنوعی همواره مطلوب نمی باشد، زیرا انعطاف بیش از حد مدل موجب براز بیش از حد مدل خواهد شد به عبارت دیگر مدل در این صورت در فرآیند یادگیری مقادیر خطا را نیز آموزش دیده و حساسیت مدل را برای تعمیم به داده های جدید کاهش می دهد.
در مورد تعداد لایه پنهان نیز اغلب یک لایه پنهان به تنهایی کافی می باشد، لیکن در اینصورت سرعت یادگیری کاهش خواهد یافت، با افزودن لایه پنهان دوم سرعت یادگیری تسریع می گردد. برای تعیین تعداد نرونها اغلب مشابه مدل رگرسیون از روش گام به گام استفاده می شود. در روش رگرسیون گام به گام یک مدل با تعداد کمی از متغیرها شروع می کند و پس از آن متغیرهای مهم را یک به یک به مدل اضافه می نمایند و یا یک مدل گام به گام ممکن است با کلیه متغیرهای موجود حل مساله را شروع کند و پس از آن گام به گام متغیرهای که اهمیت کمتری دارند، را حذف نماید. همین استراتژی در مورد شبکه های عصبی نیز مصداق دارد.
به عنوان مثال شبکه های همبستگی کاسکید با صفر نرون در لایه پنهان شروع و در هر زمان یک نرون به لایه پنهان اضافه می کند. تا اینکه شاخص خطا ارضاء شود و یا در برخی موارد با تعداد کمی نرون شروع می کند و به تدریج نرونهای زائد را حذف می نماید. در هر حال نتایج حاصل از بررسی ها حاکی از آن است که استفاده از شبکه های با تعداد نروهای زیاد به جای استفاده از شبکه سخت با نرونهای ثابت برای دستیابی به جواب خوب از کارایی بالاتری برخوردار هستند. در این رساله از این روش برای تعیین تعداد نرونها در لایه پنهان استفاده شده است.
نسبت های مالی
برخی متغیرهای برآورد کننده که روی ریسک اعتباری و ظرفیت اعتباری مشتریان اثر می گذارند و اغلب در تحقیقات مالی مورد استفاده قرار می گیرد به شرح زیر است:

الف) نسبت های نقدینگی
1- نسبت جاری دارائیهای جاری
بدهیهای جاری
این نسبت هر چه بزرگتر باشد، آن شرکت در پرداخت بدهیهای جاری با مشکلات کمتری روبرو می شود. اگر این نسبت 2 یا بزرگتر از 2 باشد، شرکت در پرداخت بدهیها جاری مشکلی نخواهد داشت.
2- نسبت آنی موجودی کالا ـ داراییهای جاری
بدهیهای جاری
این نسبت باید برابر با 1 یا بیش از یک باشد.
ب) نسبتهای فعالیت:
این نسبتها نشان دهنده کارایی شرکت در مدیریت داراییهایش می باشد. این نسبتها گردش اقلام دارایی شرکت را اندازه گیری می کنند.
1- گردش موجودی کالا فروش
موجودی کالا
گردش زیاد موجودی کالا نشان دهنده کارایی مدیریت شرکت است.
2- نسبت گردش کل دارایی ها = فروش خالص
کل داراییها
3- متوسط فروش نسیه در روز = بدهکاران تجاری
کل دارائیها
4- متوسط دوره وصول مطالبات =حسابهای دریافتی
متوسط فروش نسیه در روز
ج) نسبت های بدهی یا اهرمی:
این نسبت ها میزان منابعی که شرکت از راه گرفتن وام تامین می کند را محاسبه می نماید. همچنین تعدادی از این نسبتها توان شرکت در ایجاد سود کافی برای پرداخت شرکت را نشان می دهد.
1- نسبت وامهای بلند مدت به حقوق صاحبان سهام
= وامهای بلندمدت
حقوق صاحبان سهام
2- نسبت کل بدهی ها به کل دارایی ها
= کل بدهی ها
کل دارایی ها
این دو نسبت ریسک مالی شرکت را نشان می دهند. هر چه این نسبت ها بزرگتر باشند، ریسک مالی شرکت بیشتر خواهد بود.
3- توان پرداخت بهره
= سود قبل از بهره و مالیات
وامهای بلند مدت
د) نسبت های سود آوری
1- نسبت حاشیه سود
= سود خالص
خالص فروش
با این نسبت، سودآوری هر ریال فروش را محاسبه می کنند.
2- نرخ بازده سرمایه گذاری (ROI)
سود خالص
کل داراییها = نرخ بازده دارایی ها (ROI)
این نسبت، سود هر ریال از وجوه سرمایه گذاری (دارایی ها) را در شرکت محاسبه می کند.
3- نسبت گردش دارایی ها
= فروش خالص
کل داراییها
4- نرخ بازده حقوق صاحبان سهام (ROE)
= سود خالص
حقوق صاحبان سهام
5- اهرم مالی

= Y سود قبل از بهره و مالیات
= I هزینه بهره
= E سود سهام ممتاز
= T نرخ مالیات
هر چه این اهرم بزرگتر باشد ریسک مالی شرکت بیشتر است.
نسبتهای مالی اولیه که در بانک ملت به منظور تجزیه و تحلیل اطلاعات مالی مشتریان اعتباری بکار گرفته شده است به شرح زیراست:
= R1 نسبت جاری بر طبق پرسشنامه
R1 = X14/X20
X14 = جمع داراییهای جاری
X20 = جمع بدهی جاری بر طبق پرسشنامه
R2 = نسبت آنی بر طبق پرسشنامه اعتباری
R2 = (X14-X10)/X20
X14 = جمع دارایی های جاری
X10 = موجودی کالا
X20 = جمع بدهی جاری
R3 = متوسط فروشی نسیه بر طبق پرسشنامه اعتباری
R3 = X12/360
X12 = بدهکاران تجاری
R4 = متوسط دوره وصول مطالبات بر طبق پرسشنامه اعتباری
R4= X11/R3
X11 = اسناد دریافتی
R3 = متوسط فروش نسیه
R5 = نسبت بدهی ها به دارایی ها بر طبق پرسشنامه اعتباری

X16 = جمع کل دارایی ها
X21 = سرمایه
X22 = اندوخته ها و ذخایر
X23 = سود و زیان سنواتی
R6 = نسبت بدهی ها به دارایی ها بر طبق گزارش اطلاعات اعتباری

X25 = جمع بدهی های جاری
X27 = بدهی بلندمدت
X24 = جمع دارایی های جاری
X28 = جمع دارایی های ثابت
R7 = نسبت گردش کل دارایی ها بر طبق گزارش اطلاعات اعتباری

X29 = کل فروش سالیانه
X28 = جمع دارایی های ثابت
X25 = جمع دارایی های جاری
R8 = گردش موجودی کالا

X29 = کل فروش سالیانه بر طبق گزارش اطلاعات اعتباری
X10 = موجودی کالا بر طبق پرسشنامه اعتباری
R9 = نسبت وامهای بلندمدت به حقوق صاحبان سهام

X27 = بدهی بلندمدت (بر طبق گزارش اطلاعات اعتباری)
= حقوق صاحبان سهام (بر طبق پرسشنامه اعتباری)
R10 = نسبت حاشیه سود (بر طبق گزارش اطلاعات اعتباری)

X30 = سود یا زیان سالیانه
X29 = کل فروشی سالیانه
ROA = R11 (نرخ بازده دارایی ها) بر طبق گزارش اطلاعات اعتباری

X30 = سود و زیان سالیانه
X28 = دارایی های ثابت
X24 = دارایی های جاری
R12 = نرخ بازده دارایی ها بر طبق پرسشنامه

X23 = سود و زیان سنواتی
X16 = جمع دارایی های
R13 = نرخ بازده حقوق صاحبان سهام (ROE) بر طبق گزارش اطلاعات اعتباری

X30 = سود و زیان سالیانه
X24 = جمع دارایی های جاری
X28 = جمع دارایی های ثابت
X25 = جمع بدهی های جاری
X27 = جمع بدهی های بلندمدت
R14 = نسبت جاری بر طبق گزارش اطلاعات اعتباری

X24 = دارایی های جاری
X25 = بدهی های جاری
R15 = نسبت سود یا زیان سالیانه به مانده بدهی مشتری به شعبه

X29 = سود یا زیان سالیانه
X54 = جمع مانده بدهی مشتری به شعبه
R16 = نسبت سود یا زیان سالیانه به مانده بدهی مشتری به سیستم بانکی

X32 = مانده بدهی مشتری به سیستم بانکی
X29 = سود یا زیان سالیانه
R17 = نسبت مانده بدهی مشتری به شعبه به گردش بستانکار

X37 = گردش بستانکار حساب جاری مشتری در نزد سیستم بانکی
X54 = جمع مانده بدهی مشتری به شعبه
R18 = نسبت مانده بدهی مشتری به سیستم بانکی به گردش بستانکار

X32 = مانده بدهی مشتری به سیستم بانکی
X37 = گردش بستانکار حساب جاری مشتری در نزد سیستم بانکی
R16 = نسبت اصل و فرع وام به گردش بستانکار

X48 = اصل و فرع وام
X37 = گردش بستانکار حساب جاری مشتری در نزد سیستم بانکی
R20 = نسبت اصل و فرع وام به معدل

X38 = معدل سه ماهه حساب جاری مشتری
R21 = نسبت اصل و فرع وام به مانده حساب جاری مشتری

X35 = مانده سه ماهه حساب جاری مشتری در شعبه
R22 = متوسط نسبتهای اصل و فرع وام به گردش بستانکار، معدل مانده حسابجاری مشتری

R19 = نسبت اصل و فرع وام به گردش بستانکار
R20 = نسبت اصل و فرع وام به گردش معدل
R21 = نسبت اصل و فرع وام به گردش مانده
R23 = نسبت بروات تصمینی به سایر وثایق (ملکی و ماشین آلات)

X45 = بروات تصمینی
X44 = وثایق ماشین آلات
X42 = وثایق ملکی
R24 = نسبت جمع تسهیلات اعطایی به دارایی ها

X31 = جمع تسهیلات اعطایی نزد سیستم بانکی

X24 = دارایی های جاری
X28 = دارایی های ثابت
R25 = نسبت مانده بدهی به سیستم بانکی به دارایی ها

X24 = دارایی های جاری
X28 = دارایی های ثابت
X32 = مانده بدهی مشتری به شعبه
R26 = نسبت فروش به داراییها بر طبق گزارش اطلاعات اعتباری

X29 = فروش
X28 = داراییهای ثابت
R27 = نسبت سود به فروش بر طبق گزارش اطلاعات اعتباری

X30 = سود
X29 = فروش

مقدمه
در این بخش مروری بر روی 5 الگوریتم رایج دسته بندی که در تشخیص بدحسابی مشتریان بکار رفته اند، خواهیم داشت. دو تکنیک آماری (تحلیل تمایزی خطی و رگرسیون لجستیک) بخاطر اینکه سابقه کاربردی زیادی دارند و معمولاً برای محک زدن تکنیک های دیگر داده کاوی بکار می روند معرفی شده اند (Kattan , 1997). قابل ذکر است که تعداد زیادی ویرایش از الگوریتم های معرفی شده زیر وجود دارد که در اینجا تنها به یک ویرایش از هر الگوریتم پرداخته می شود. از آنجا که جزئیات الگوریتم، هدف اصلی این تحقیق نیست، در اینجا تنها به توضیح مفهومی الگوریتم ها اکتفا شده است. در پایان تحقیق مراجعی بر خواندن علاقه مند به جزئیات هر کدام از الگوریتم ها آمده است.
نخست، لازم است نمادهای بکار رفته در توضیحات این بخش آورده شود که به قرار زیر هستند:
1. : بردار مشخصه های نمونه ها در مجموعه داده D و پارامتر k تعداد مشخصه ها می باشد.
2. Case (X) : نمونه ای که بردار مشخصه آن مقدار معین X دارد.
3. : i امین کلاس در مجموعه داده D با این فرض که عناصر درون D قابل دسته بندی به l کلاس می باشد.
4. : تعداد مواردی در مجموعه داده ها D به کلاس i ام تعلق دارد.
5. Pr (X) : احتمال غیر شرطی برای نمونه معین (Case (X))X
6.) Pr (X|Ci : احتمال شرطی نمونه X به شرط تعلق به کلاس Ci
7. Pr(Ci) : احتمال پیشین است و احتمال تعلق هر نمونه ای را به کلاس Ci بیان می کند.
8. Pr(Ci|X) : احتمال پسین است و احتمال تعلق نمونه X را به کلاس Ci نشان خواهد داد.
تحلیل تمایزی خطی بیزی
تحلیل تمایزی1در گروه دسته بندی کننده هایی قرار می گیرد که دارای شکل تابع تمایز هستند. تحلیل تمایزی خطی بیزی یکی از روش های موجود در آن می باشد. این روش یکی از رایج ترین روش هایی است که برای فراهم کردن مدل های دسته بندی بکار می روند و معمولاً در هنگام مقایسه با دیگر تکنیک های مدل سازی به عنوان یک معیار بکار می رود.
قاعده اساسی دسته بندی بیز:
توضیح زیر از مرجع (Cios , 1998) صفحات 131 تا 147 گرفته شده است.
یک قاعده دسته بندی می تواند به شکل زیر بیان شود:
Case (X) را به کلاس Cj تخصیص دهید هر گاه:
قاعده 1
با استفاده از قضیه بیز2قاعده دسته بندی بیز به شکل زیر بدست می آید:
Case (X) را به کلاس Cj تخصیص دهید هر گاه
قاعده 2
حال فرض شود که هزینه دسته بندی غلط نمونه ای که به Ci تعلق دارد و به طور اشتباه در کلاس Cj قرار گیرد Lij باشد، آنگاه هزینه انتظاری متناظر با دسته بندی غلط Case (X) در Cj برابر خواهد بود با:
2-1
دسته بندی باید بر اساس اصل کمینه کردن هزینه دسته بندی غلط بنا نهاده شود. از طرفی دیگر قاعده کمینه سازی هزینه دسته بندی بیز به صورت زیر قابل بیان است:
Case (X) را به کلاس Cj تخصیص دهید هر گاه:
قاعده
با استفاده از قضیه بیز برای مساله با دو دسته، قاعده دسته بندی زیر را خواهیم داشت:3
قاعده
و در غیر این صورت به کلاس C2 تخصیص دهید.
قاعده 2 قاعده دسته بندی برای کمینه کردن احتمال خطای دسته بندی است و قاعده قاعده دسته بندی برای کمینه کردن هزینه انتظاری دسته بندی غلط می باشد.
تحلیل تمایز خطی:
تحلیل تمایزی خطی (LDA) معرفی شده در این جا بر اساس قاعده دسته بندی بیز قسمت قبل بنا نهاده شده است. توضیح زیر از مرجع (Yobas , 2000) صفحات 112 و 113 گرفته شده است. نمادها:
1. f (X|Ci) : تابع چگالی احتمال شرطی کلاس که توزیع بردار مشخصه ها را در داخل هر کلاس Ci نشان می دهد.
2. f (X) : تابع چگالی غیر شرطی برای بردار مشخصه ها
اگر فرض کنیم که دارای توزیع نرمال چند متغیره باشد و ماتریس کواریانس کلاس های مختلف هم، یکسان باشد، آنگاه با عبارت زیر داده می شود:
2-2
بطوریکه بردار میانگین بردار مشخصه های برای کلاس i ام می باشد. ماتریس کواریانس بردار مشخصه ها برای همه کلاس ها است.
حال می توانیم معادل قاعده 2 را با گرفتن لگاریتم طبیعی از طرفین نامعادله قاعده 2 بدست آوریم:
Case (X) را به کلاس Cj تخصیص دهید هر گاه:
قاعده 3
و قاعده دسته بندی اصلاح شده از قاعده 2 برای مساله با 2 دسته شکل خواهد بود Case (X) را به کلاس C1 تخصیص دهید. هرگاه:
قاعده

در غیر این صورت به کلاس C2 تخصیص دهید.
با جایگذاری معادله در قاعده 3 و قواعد 4 و بدست می آیند:
Case (X) را به کلاس Cj تخصیص دهید. هر گاه:
قاعده 4
و برای حالت دو دسته ای داریم:
Case (X) را به کلاس C1 تخصیص دهید. هر گاه:
قاعده
قاعده 4 قاعده تمایز خطی نهایی بر مسائل با بیش از 2 کلاس و بدون ملاحظه عواملی هزینه روی دسته بندی غلط می باشد. قاعده قاعده تمایز خطی نهایی برای مسائل با 2 کلاس و با ملاحظه عوامل هزینه روی دسته بندی های غلط می باشد.
و نامعلوم هستند که در قواعد بالا می توانند به ترتیب با میانگین نمونه و ماتریس کواریانس نمونه برآورده شوند. برآورد نسبت احتمالهای پیشین و محاسبه نسبت هزینه دسته بندی غلط در عمل تاثیر فوق العاده ای روی نتایج دارند. اولی با نسبتهای نمونه یعنی برآورد می شود و ممکن است برای جمعیت هایی که نمونه اخذ شده، نمونه ای تصادفی نباشد، برآوردی اریب باشد (Rosenberg , 1994). اما برآورد در عمل بسیار مشکل تر است.
از آنجا که قواعد ترکیب خطی از X هستند به این تکنیک نام تحلیل تمایزی خطی اطلاق شده است. شکل 3-1 ، LDA را برای مساله با 2 کلاس و دو مشخصه نشان می دهد. یک خط (یک ابر صفحه در فضای متغیر k بعدی) به وسیله تابع تمایز خطی بدست می آید که نمونه های خوب و بد را از هم جدا می کند. می توانیم خط را تغییر دهیم و کلاس ها را به حالات دیگر متمایز کنیم.
در واقع تعیین مکان خط می تواند جایگزین محاسبات و شود. مکان خط به وسیله ثابت خطی تمایز تعیین می شود. و اجزاء این ثابت هستند. این موضوع بدین معنی است که زمانیکه خط برش تعیین شود (در مورد آن تصمیم گرفته شود) نیازی به محاسبه و نمی باشد.
رگرسیون لجستیک
رگرسیون لجستیک برای مسائل دسته بندی مشتریان در موارد زیادی بکار رفته است. بعضی تحقیقات نشان داده اند که رگرسیون لجستیک از نظر اعتبار عملکرد بهتری از تحلیل تمایزی خطی در مسائل دسته بندی مشتریان دارد (Kronborg , 1998) . علاوه بر این، رگرسیون لجستیک امکان تفسیر متغیر خروجی به عنوان مقدار دودویی احتمالی را فراهم می کند. این بدان معنی است که اگر ما پیش بینی کردیم که مشتری جدیدی بدحساب خواهد بود، نتیجه پیش بینی صریحاً به صورت جواب بله/خیر اولیه نیست، بلکه با ملاحظات بیشتر به صورت احتمالی برآورد شده، و از حالت بله/خیر مطلق خارج می شود. خروجی پیش بینی پیوسته است و از اینرو برای دسته بندی باید تعدادی نقطه آستانه ای مرتبط (نقطه جوش) تعیین گردد.
رگرسیون لجستیک نوعی از رگرسیون معمولی است و بخصوص زمانیکه خروجی مشاهده شده محدود به 2 مقدار باشد، بسیار مفید است. تعداد خروجی (2 حالت) معمولاً اتفاق و یا عدم اتفاق یک رخداد را بیان می کنند. (معمولاً به ترتیب با 1 و 0 کدگذاری می شوند). رگرسیون لجستیک فرمولی را بدست می آورد که احتمال اتفاقی را به عنوان تابعی از متغیرهای مستقل پیش بینی می کند.
اگر مشتریان از لحاظ رفتار پرداخت به دو گروه خوش حساب و بدحساب دسته بندی شوند، آنگاه نشانه بدحساب و به نشانه خوش حساب است. رگرسیون لجستیک می تواند احتمال را پیش بینی کند که نشان دهنده احتمال تعلق Case (X) به دسته مشتریان بدحساب می باشد. فرض می شود برادر مشخصه های مشتریان باشد. احتمال برای اختصار در توضیحات زیر با P نشان داده می شود.
رگرسیون لجستیک درست مانند رگرسیون خطی، به هر ضریب را می دهد که نقش یا تاثیر هر را در تغییرات P اندازه گیری می کند. اما آنچه که قصد پیش بینی آن را به وسیله داریم یک مقدار عددی معمولی نیست، بلکه یک احتمال است (P). این احتمال در رگرسیون معمولی نمی تواند متغیر وابسته باشد. بطور مثال در رگرسیون خطی شده، به دلیل اینکه ممکن است نامحدود باشد. اگر P را به عنوان تابعی خطی از آنها بدانیم، ممکن است در پیش بینی انجام شده P بیش از 1 بدست آید (که نمی تواند درست باشد، چرا که احتمال همواره مقداری بین 0 و 1 دارد).
این مشکل با ساخت تبدیل لجستیک P حل شده است و اصطلاحاً به این کار گرفتن Logit P گویند. Logit P لگاریتم (در پایه نپر) احتمال و یا نیست راستنمایی4 می باشد و به صورت زیر تعریف می شود:
2-3
بطوریکه P در فاصله 0 تا 1 تغییر می کند و Logit (P) بین تا متغیر است.
به این طریق به رویکرد رگرسیون لجستیک می رسیم که لگاریتم احتمالات را با ترکیب خطی از متغیرهای مشخصه بدست می آورد. یعنی:
2-4
حال احتمال P بدین طریق محاسبه می شود:
2-5
پارامترهای به وسیله تابع حداکثر راستنمایی برآورد می شوند. برآورد حداکثر راستنمایی در گذشته با مشکل همراه بوده است چرا که بعضاً تکنیک های بهینه سازی غیر خطی و یا رویه های تکراری لازم دارد و از نظر محاسباتی بسیار سخت تر از رگرسیون خطی است. اما توانایی محاسباتی کنونی این مشکل را حل کرده است.
فراگیری مورد ـ مبنا5
در الگوریتم های مورد ـ مبنا نمونه های آموزشی به حافظه الگوریتم سپرده می شوند و زمانی که باید درباره نمونه جدید تصمیم گرفته شود، در میان نمونه های ذخیره شده جستجو می شود و الگویی که بیشترین شباهت را با نمونه جدید داشته باشد، پیدا می کند. یادگیری در زمان درخواست اتفاق می افتد و بهمین خاطر بعضاً به آن یادگیری تنبل یا یادگیری حافظه ـ مبنا گفته می شود.
یادگیری نمونه ـ مبنا ویژگی های جذاب زیادی دارد که آن را برای تشخیص بدحسابی مناسب جلوه می دهد. ماهیت ناپارامتری آن امکان مدلسازی نامنظمی در توابع ریسک در فضای مشخصه را فراهم می کند. این روش رویه نسبتاً جالبی دارد و به راحتی برای مدیران تجاری ـ که باید اجرای آن را تایید کنند ـ قابل توضیح است. یعنی از نظر مفهومی بسیار واضح و ساده است و به هر دو صورت پویا و افزایشی همراه با روزآمد کردن خودکار مدل و همگام با تغییرات نمونه بکار می رود (Henley , 1997).
K نزدیکترین همسایه
تئوری پایه آماری K-NN از مرجع (Cios , 1998) برداشته شده است و توضیحات زیر از مرجع (Henley , 1997) می باشد. در فصول بعد این الگوریتم به تفصیل مورد بحث قرار می گیرد.
احتمال اینکه نمونه جدیدی با بردار مشخصه X به کلاس Ci تعلق داشته باشد را فرض کنید. آنگاه یک برآورد K-NN از به وسیله تعیین می شود که تعداد موارد متعلق به کلاس Ci در بین نمونه با بیشترین شباهت به X از بین مجموعه آموزشی با برچسب معلوم می باشد. برای محاسبه شباهت بین نمونه آموزش داده شده و موارد جدید از تابع فاصله استفاده می شود. K نمونه همان K نمونه با کمترین فاصله می باشند که در آن K عددی کوچک و ثابت است. قاعده استاندارد دسته بندی بدین صورت است:
Case (X) را به کلاس Ci تخصیص دهید هر گاه:
قاعده 5
کلاس نمونه جدید به وسیله کلاس حداکثر در بین K نمونه مشخص می شود. شکل 3-2 روش K-NN را با دو مشخصه نشان می دهد.
رویکردهای مختلفی برای تعریف تابع فاصله وجود دارد که بعضی ها در اینجا ذکر می شوند. فاصله بین نمونه با مقادیر مشخصه (که m تعداد مشخصه ها می باشد) و نمونه با مقادیر مشخصه
بدینصورت تعریف می شود:
فاصله اقلیدوسی
و یا
فاصله مان هاتان6
رگرسیون وزنی محلی (LWR) 7
رگرسیون وزنی محلی یکی از روش های مورد ـ مبنا است که برای پیش بینی عددی بکار می رود. از آنجا که نتایح LWR مقادیر عددی پیوسته می باشند، از اینرو نه تنها موارد را دسته بندی می کنند بلکه نمره یا درجه ای را نیز بدست می آورند که می تواند به عنوان احتمال تعلق به یک کلاس تفسیر شود. در زمینه کاربرد بدحسابی مشتریان نمره های پیوسته بسیار از دسته بندی صرف دودویی (خوب یا بد) مفیدتر است. توضیح مختصری از الگوریتم در زیر آمده است.
برای یک نمونه آزمایشی جدید روش LWR با استفاده از وزن دهی نمونه های در همایسگی نمونه آزمایشی، مدل های رگرسیون خطی محلی تولید می کند. یعنی نمونه های آموزش داده شده را بر اساس فاصله آنها از نمونه آزمایشی وزن دهی می کند و سپس یک مدل رگرسیون خطی را روی داده های وزنی می سازد.
در وزن دهی موارد آزمایش راهکارهای مختلفی وجود دارد. رایج ترین این راهکارها برای وزن دهی نمونه ها بر اساس معکوس فاصله اقلیدسی آنها از نمونه آزمایشی است. روش دیگر استفاده از فاصله اقلیدسی به همراه تابع مرکزی گوسی است. در اینصورت نمونه های آموزش داده شده که به نمونه آزمایشی نزدیکتر هستند، دارای وزن بالاتری هستند و آنهایی که از نمونه آزمایش دورتر هستند دارای وزن پایین تری هستند.
پارامتر مهمی که در این روش ها حائز اهمیت است "پارامتر هموارسازی" است چرا که فاصله در معکوس این پارامتر ضرب می شود. اگر که این پارامتر کوچک گرفته شود، نمونه های بیشتری تاثیر بالایی روی مدل رگرسیون خطی خواهند داشت. با استفاده از مقدار مناسب برای این پارامتر می توان اغتشاش8 را در مجموعه داده ها کاهش داده و آن را هموار نمود. پارامتر هموارسازی می تواند برابر فاصله K امین نمونه نزدیک قرار داده شود. در اینصورت، اگر معکوس فاصله بعنوان وزن بکار رود، K نزدیکترین نمونه، وزنی بزرگتر از 1 را خواهند داشت و سایر مواد وزنی کمتر از 1 خواهند داشت.
درخت های تصمیم
روش درخت های تصمیم در هر دو حوزه آمار (Breiman , 1984) و فراگیری ماشین (Quinlan , 1993) توسعه یافته است. C4.5 الگوریتمی است که می تواند درخت هایی برای پیش بینی عددی فراهم کند و نخستین بار توسط کوینلن (Quinlan , 1993) توسعه یافته است. اگرچه درخت تصمیم مقادیر عددی پیوسته تولید می کنند، اما می توانند برای مسائل دسته بندی بکار روند و مقادیر عددی پیوسته به عنوان احتمالات تقریبی تعلق به یک کلاس در نظر گرفته شوند (Frawley , 1997). در زیر توضیحی از الگوریتم C4.5 آمده است که از مرجع (Kantardzic , 2003) انتخاب شده است. در فصل ششم الگوریتم به تفصیل شرح داده می شود.
مهمترین قسمت الگوریتم C4.5 فرآیند ساخت یک درخت تصمیم اولیه از داده های آموزشی است. بنابراین، این الگوریتم یک دسته بندی کننده در قالب درخت تصمیم با استفاده از داده ها تولید می کند. درخت تصمیم، ساختاری است دارای دو نوع گره: گره های برگ که نشان دهنده یک کلاس هستند و گره های تصمیم که بعضی تست ها روی مقدار یک متغیر در آن انجام می شود. خروجی گره تصمیم می تواند تشکیل زیر درخت های دیگر دهد و یا به یک برگ برسد.
می توان درخت تصمیم را با شروع از ریشه درخت و حرکت در طول شاخه های آن تا رسیدن به یک برگ برای دسته بندی نمونه های جدید بکار برد. در هر گره تصمیم غیربرگ، خروجی مشخصه ها برای هر تست در گره، تعیین گردیده و سپس توجه خود را به زیر درخت های به وجود آمده معطوف می کنیم. به عنوان مثال، اگر مدل دسته بندی مساله با درخت تصمیم شکل 3-3 داده شده باشد و نمونه هایی که قرار است دسته بندی شوند مطابق جدول زیر باشند، آنگاه الگوریتم، مسیری از گروه های A ، C و F (گره برگ) را طی می کند تا به تصمیم دسته بندی نهایی برسد که نشان دهنده برچسب کلاس 2 برای نمونه مفروض است همین طور ممکن است مسیر A ، B و D (گره برگ) برای رسیدن به برچسب کلاس 2 طی شود.
شکل 3-3: دسته بندی نمونه های جدید بر اساس مدل درخت تصمیم
اسکلت الگوریتم C4.5 بر اساس روش CLS هانت9 جهت ساخت درخت تصمیم از مجموعه نمونه های آموزشی T می باشد. فرض شود که برچسب کلاس ها به وسیله نمایش داده می شود. 3 حالت ممکن برای محتویات مجموعه T وجود دارد:
1. T دارای یکی یا بیشتر نمونه است و همه تنها متعلق به دسته Cj هستند. درخت تصمیم برای T دارای یک برگ است که دسته Cj را نشان می دهد.
2. T دارای هیچ نمونه نیست. در اینجا هم درخت تصمیم یک برگ است. با این تفاوت که برچسب کلاس مرتبط با این برگ باید از روی اطلاعات خارج T تعیین شود. این کار مثلاً از روی کلاس غالب قرار گرفته در بالای آن برگ انجام می شود. الگوریتم C4.5 معیار بیشترین کلاس تکرار شده در گره های بالایی (گره های والد) را در این حالت بکار می برد.
3. T دارای نمونه هایی است که همگی متعلق به یک کلاس نیستند، بلکه حداقل 2 نمونه متعلق به کلاس های متفاوت هستند. در این حالت، باید مجموعه T را باید بگونه ای به زیر مجموعه های جدید تقسیم کرد که نمونه های با برچسب کلاس مشابه در یک گره قرار گیرند. این کار ممکن است طی یک مرحله قابل تحقق نباشد. بنابراین بهتر است گفته شود به این سمت پیش می رویم که همه نمونه های با برچسب مشابه در یک گره قرار بگیرند. در این حالت یک تست بر اساس یکی از مشخصه ها که دارای مقادیر مانعه الجمع می باشد، انجام می گیرد. بدین وسیله T به زیر مجموعه های تقسیم می شود که در آن نمونه های Ti شامل همه نمونه هایی در T است که در مشخصه تست شده، دارای مقدار یکسان Oi هستند.
رویه ساخت درخت مشابه رویه فوق، بطور مکرر روی هر زیر مجموعه از نمونه های آموزشی بکار می رود، بطوریکه i امین شاخه به درخت تصمیمی برسد که از زیر مجموعه نمونه های آموزشی Ti ساخته شده است. تقسیم متوالی مجموعه نمونه های آموزشی تا زمانیکه همه زیر مجموعه شامل نمونه های با کلاس مشابه باشند، ادامه می یابد.
فرایند ساخت درخت یکتا نیست و ممکن است برای یک مجموعه داده درخت های متفاوت را داشته باشیم. برای آزمون های مختلف و حتی توالی های مختلف تست ها، درخت های متفاوت بدست می آید. مطلوب است انجام تست ها بگونه ای باشد که درخت نهایی کوچک باشد.
پیچیدگی محاسباتی درخت تصمیم
مطمئناً جواب دقیق (بهترین درخت) به وسیله ساخت همه درخت های ممکن بدست می آید. اما مساله یافتن کوچک ترین درخت تصمیم متناظر با مجموعه ای از نمونه های آموزشی NP-Complete است. شمارش و تحلیل همه درخت های ممکن به یک انفجار ترکیباتی برای هر مساله واقعی منتهی می شود. بطور مثال، برای یک پایگاه داده کوچک که شامل 20 نمونه بوده و تنها 5 مشخصه هر نمونه را توصیف می کند، تعداد کل درخت های ممکن بیش از 106 درخت می باشد و این تعداد هم خودش به مقادیری که هر مشخصه به خود می گیرد وابسته است. از این رو بیشتر روش های ساخت درخت تصمیم، غیرقابل ردیابی از پایین به بالا هستند و این بخاطر الگوریتم های کوته بین10 بکار رفته در ساخت آن است. بنابراین به محض انتخاب یک مشخصه و انجام تست روی آن با استفاده از روش های ابتکاری جهت بیشینه کردن شاخص پیشرفت و تقسیم مجموعه داده های آموزشی، متاسفانه دیگر وضعیت های جایگزین کنار گذاشته می شوند. شاخص پیشرفت، یک شاخص محلی است و معیار بهره11برای انتخاب یک تست مبتنی است بر اطلاعات موجود برای یک گام خاص از شکستن مجموعه داده ها (تقسیم به زیر مجموعه ها).
فرض کنید در پی انتخاب یک تست با تعداد حالت ممکن n هستیم (n مقدار برای یک مشخصه) که در نتیجه مجموعه داده های آموزشی T را به زیر مجموعه های تقسیم می کند. تنها اطلاعات موجود برای راهنمایی این کارف توزیع کلاس ها در T و زیر مجموعه های آن یعنی Ti می باشد. اگر S یک زیر مجموعه از نمونه ها باشد، آنگاه فرض کنید نشان دهنده تعداد نمونه هایی از S باشد که به کلاس Ci (از بین K کلاس) تعلق دارند و فرض شود |S| تعداد کل نمونه های موجود در S را نشان دهد.
الگوریتم اصلی ID3 معیاری به نام بهره (gain) جهت انتخاب یک مشخصه و انجام تست روی آن بکار می برد که مبتنی بر مفهوم آنتروپی12 تئوری اطلاعات بود. این معیار در الگوریتم C4.5 نیز بکار می رود. روابط زیر، نحوه محاسبه آنتروپی مجموعه فرضی S را نشان می دهند:
2-6
همین شاخص را برای T که قرار است با تست روی مشخصه X به زیر مجموعه های تقسیم شود، بکار می رود. اطلاعات انتظاری لازم می تواند به صورت مجموع وزنی آنتروپی ها روی زیر مجموعه حاصله باشد، یعنی:
2-7
و شاخص بهره که بصورت زیر تعریف می شود، اطلاعات بدست آمده به وسیله تقسیم T با استفاده از مشخصه X را نشان می دهد. مطابق با این معیار باید تستی را انجام داد که بیشترین Cain (X) را در پی دارد.
2-8
بطور کلی الگوریتم C4.5 مکانیزم هایی برای انجام 3 نوع تست زیر را دارد:
1. تست استاندارد روی یک مشخصه گسسته با مقادیر معین و برای هر مقدار خروجی آن یک شاخه در نظر گرفته می شود (انشعاب).
2. اگر مشخصه Y یک مشخصه با مقادیر عددی پیوسته باشد، یک تست دوتایی با خروجی های و می توان تعریف نمود و به وسیله مقایسه مقادیر آن با یک مقدار آستانه ای مانند Z تست را انجام داد.
3. یک تست پیچیده تر که روی یک مشخصه گسسته انجام می شود و در آن ممکن است، مقادیر ممکن به تعدادی متغیر متعلق به گروه ها تخصیص یابد که برای هر گروه یک خروجی و در نتیجه یک شاخه بدست می آید.
در این تحقیق بیشتر مشخصه ها قبل از استفاده از PCA پیوسته اند. پس از استفاده از تکنیک PCA بجز 1 متغیر که نشان دهنده شماره خوشه متعلق به آن است، همه متغیرها پیوسته هستند. انجام تست برای حالت گسسته واضح است و نیازی به توضیح ندارد. در اینجا برای روشن شدن موضوع انجام تست برای متغیرهای با مقادیر پیوسته شرح داده می شد. در ابتدا به نظر می رسد که انجام تست برای متغیرهای پیوسته کار سختی باشد، چرا که این متغیرها هر مقداری را می توانند بخود بگیرند و اصولاً عددی را برای مقدار آستانه ای نمی توان در نظر گرفت. اما این کار با استفاده از الگوریتم ساده تر به آسانی قابل انجام است.
در ابتدا نمونه های آموزشی به ترتیب مقادیر مشخصه Y (صعودی یا نزولی) مرتب می شوند. در واقع تعدادی معین و متناهی از این مقادیر در مجموعه داده های آموزشی وجود دارد، لذا می توان مقادیر مرتب شده را به شکل نشان داد.
هر مقدار آستانه ای که بین و قرار گیرد، تاثیر مشابهی در تقسیم نمونه هایی دارد که مقدار مشخصه Y در آنها بین مجموعه و آنهایی که مقدار مشخصه Y آنها متعلق به قرار دارد. بنابراین تنها (m-1) مقدار آستانه ای روی Y لازم است تا بتوان بطرز سیستماتیکی تست های لازم را روی مشخصه های پیوسته انجام داد. معمول است که مقدار آستانه ای (نقطه شکست) را برای مقادیر و برابر فرض شود. اما الگوریتم C4.5 مقدار کوچکتر را بین و بجای مقدار متوسط آنها بکار می برد. با این کار در بین قواعد استخراج شده نهایی روابط و وجود داشته و علاوه بر این، متغیرها مقادیر آستانه ای هم در بین نمونه ها وجود دارد. یعنی مقدار آستانه ای مقداری واقعی است.
شبکه های عصبی
شبکه های عصبی مصنوعی ابزاری تحلیلی آموزش پذیر هستند که تلاش می کنند تا الگوهای پردازش اطلاعات در مغز بشر را تقلید کنند. شبکه های عصبی مصنوعی سیستم های دینامیکی هستند متشکل از واحدهای پردازش موازی یا همان نرون ها که میل باطنی برای حفظ دانش تجربی و در دسترس قرار دادن آن دانش برای استفاده دارند. مهمترین مزیت شبکه های عصبی مصنوعی غیر خطی بودن و تطابق پذیری آنهاست که بیشتر تکنیک های سنتی (مثلاً رگرسیون) از آن بی بهره اند.
طبق تحقیق هورنیک (Hornik , 1989) شبکه های پیش خور سه لایه13 با یک تابع منتقل کننده شناخت14 در واحد لایه خروجی و توابع لجستیک در واحدهای لایه میانی و با تعدادی معین نرون در لایه میانی، بخوبی می توانند هر تابع پیوسته دلخواهی را تقریب بزنند. شکل 3-4 شبکه پیش خور سه لایه ای را نشان می دهد. ورودی ها و خروجی می باشد. لایه ورودی تنها مقادیر ورودی را به شبکه وارد می کند. لایه های مخفی (میانی) از تعدادی معین نرون تشکیل شده است. هر نرون یک مجموع وزنی از ورودی های دریافتی از لایه قبلی را تشکیل داده و با مقداری به عنوان بایاس یا اریبی جمع کرده و بخود تابع غیر خطی فعال سازی، f (0) ، می دهد که آنرا تابع نرون نیز می نامند. عبارت های ریاضی این تابع برای نرون های لایه مخفی چنین است:
2-9
بطوری که و به ترتیب وزن ها و بایاس های متناظر واحدها می باشند. خروجی شبکه به وسیله جمع وزنی دیگری از خروجی نرون های لایه مخفی شکل می گیرد. خروجی شبکه نشان داده در شکل 1 که شبکه ای با یک خروجی است بدین شکل می باشد:
2-10
بطوری که n تعداد ورودی ها و nh تعداد نرون های لایه مخفی است. متغیرهای پارامترهای شبکه هستند که روی هم با بردار نشان داده می شوند. فرم کلی و فشرده شبکه عصبی به صورت است.
شکل 3-4: ساختار استاندارد پرسپترون چند لایه
الگوریتم یادگیری بکار رفته در این تحقیق الگوریتم رایج پس انتشار خطای ارتجاعی15می باشد. تفاوت اصلی این نوع الگوریتم برای آموزش شبکه در نحوه روزآمد شدن بردار اوزان و بایاس ها می باشد. در پس انتشار خطای معمولی بردار اوزان و بایاس به وسیله علامت (جهت) و اندازه بزرگی مشتق (گرادیان) روزآمد می شوند در حالیکه در پس انتشار خطای ارتجاعی تنها از علامت مشتق برای روزآمد کردن بردار وزن و بایاس ها استفاده می شود.
بطور کلی الگوریتم پس انتشار خطا متشکل از 2 مرحله می باشد. مرحله پیش رونده که جریان پردازش روی داده ها از لایه ورودی به سوی لایه خروجی است و مرحله پس خور که خطای مشاهده شده بین خروجی شبکه و جواب واقعی برای اصلاح مقادیر اوزان و بایاس ها در جهت عکس بکار گرفته می شود. الگوریتم استاندارد یادگیری پس انتشار خطا توسعه رومل هارت و مک کلالند (Rumelhart , 1986) معرفی شده و رایج ترین الگوریتم یادگیری است. قواعد به روزرسانی اوزان به صورت زیر است:
2-11
اگر واحد j یک واحد خروجی است.
2-12
اگر واحد j یک واحد مخفی است.
بطوری که تغییرات وزن بین نرون های i و j است. نرخ یادگیری است (ثابت). خطای متعلق به واحد j (اختلاف بین خروجی واقعی و خروجی آموزش داده شده)، خروجی آموزش داده شده واحد j و خروجی واحد قبلی یعنی i می باشد. اندیس هایi ، j و k به ترتیب، واحد قبل j ، خود j و بعد از j را نشان می دهند. در شبکه بالا پارامترهایی که باید تعیین شوند عبارتند از تعداد نرون های لایه مخفی، نرخ یادگیری و ثابت مُمنتم است. علاوه بر این از کالیبراسیون نیز برای بهینه کردن شبکه با بکار بردن مجموعه ای از تست های مستقل در طول دوره یادگیری استفاده می شود. برای شبکه های پس انتشار، کالیبراسیون موقعیت شبکه را در جایی که بهترین جواب را برای الگوهای آموزش داده تا آن موقع را در بردارد، نگهداری می کند.
پرسپترون چند لایه
تکنیک های زیادی در زمینه شبکه عصبی وجود دارند که پرسپترون چند لایه با پس انتشار خطا یکی از گزینه های انتخابی برای تصمیمات دسته بندی است. MLP-BP 16 پرطرفدارترین الگوریتم شبکه عصبی است و این مطلب بیشتر بخاطر توانایی زیاد آن در مدل سازی مسائل است (Kattan , 1997). شبکه عصبی پرسپترون چند لایه از لایه های ورودی، میانی و خروجی از نرون های به هم مرتبط تشکیل شده است. نرون های یک لایه مطابق با یک سری اوزان، با هم ترکیب شده و به لایه بعدی منتقل می شوند. در طول مرحله یادگیری داده ها به شبکه خورانده می شوند و اوزان و بایاس های شبکه بر اساس نرخ خطای حاصل از خروجی ها تنظیم و اصلاح می شوند. دوره های زیادی برای این عمل روی داده ها برای آموزش شبکه لازم است. معمولاً زمان های آموزش شبکه بالاست.
شکل 3-3 ساختار پرسپترون با یک لایه مخفی استاندارد را نشان می دهد ورودی ها به گره های ورودی داده شده و خروجی ها از گره های خروجی گرفته می شوند. لایه میانی گره ها نه برای ورودی ها و نه برای خروجی ها مرئی نیست و به این خاطر به آن لایه مخفی گفته می شود و برخلاف لایه های ورودی و خروجی اندازه آن ثابت نیست.
فرض شود که یک مجموعه داده آموزشی با k متغیر ورودی و L کلاس متشکل از n نمونه وجود دارد. i امین نمونه دارای ورودی به شکل و خروجی به شکل است. اگر که یک نمونه به کلاس i ام تعلق داشته باشد آنگاه j امین عنصر در بردار برابر 1 و بقیه برابر صفر هستند. الگوریتم پس انتشار خطا پارامترهای ماتریس اوزان را طوری تنظیم می کند که شاخص خطای زیر کمینه شود.
2-13
بطوریکه مقدار واقعی j امین خروجی باشد که با نمونه i ام مشخص شده است، مقدار خروجی مدل محاسبه شده به وسیله رابطه 2-10 می باشد.
غالباً کمینه سازی به وسیله تندترین شیب انجام می گیرد. استراتژی اساسی در تندترین شیب محاسبه گرادیان و تنظیم اوزان در جهت مخالف آن می باشد. گرادیان E(W) با نشان داده می شود و بردار مشتقات جزئی E نسبت به اوزان است یعنی:
2-14
بردار جهت بیشترین افزایش E را نشان می دهد. بنابراین تعدیل W در جهت بیشترین کاهش ممکن در E را فراهم می کند. اوزان بطور تکراری به شکل زیر تعدیل می شوند:
2-15
که در آن آخرین تغییر اوزان است. دو پارامتر اضافه شده و به ترتیب نرخ یادگیری و مُمنتم نامیده می شوند که برای تنظیم اندازه گام و سرعت تغییر بکار می روند.
فرآیند آموزش تا وقتی که خطای E به قدر کافی کاهش نیابد و یا اینکه دیگر معیارهای توقف ارضا شوند، ادامه می یابد.
مقایسه الگوریتم های معرفی شده
تکنیک ها و الگوریتم های موجود بریا دسته بندی، هر کدام دارای ویژگی های خاص خود هستند. در قسمت 2-4 به برخی از این ویژگی ها اشاره شد. در این قسمت این الگوریتم ها را از چند منظر مقایسه می کنیم.
ویژگی های ورودی
برای تحلیل تمایز خطی (LDA) ، رگرسیون لجستیک (LR) و شبکه های عصبی لازم است که متغیرهای ورودی مقادیر عددی داشته باشند. متغیرهای غیرعددی باید به متغیرهای عددی تبدیل شوند. کاربردهای LDA ملزومات بیشتری را نیاز دارند (Leker , 1993). یکی از نیازهای اساسی LDA که البته یکی از انتقادهای اصلی آن هم بشمار می رود، این فرض است که متغیرها دارای توزیع نرمال چند متغیره باشند و همچنین ماتریس های کواریانس برای گروه ها یکسان باشد. بعضی از روش های آماری توسط سازندگان مدل برای آزمون این فرض های آماری مورد استفاده قرار می گیرند.(Feidicker,1992)
بعضی دیگر از سازندگان مدل سعی دارند که متغیرهای ورودی را طوری تبدیل کنند که چگالی حاشیه ای آنها تقریباً نرمال باشد و این کار معمولاً با بکار بردن تبدیل یکنواخت از نوع توان کم انجام می شود. در بسیاری موارد اطلاعات راجع به مشتریان در فرض نرمال بودن صدق نمی کند. مثلاً، بسیاری از متغیرهای غیرعددی در اطلاعات پرداختی یا وصولی مشتریان مطمئناً بطور نرمال توزیع نشده است. اگر فرض های منظور برایLDA برقرار نباشد، قانون تمایز خطی ممکن است بهینه نباشد و جوابی آنچنان مقبول ندهد. اما، اگر به عنوان حاصل ترکیب خطی متغیرهایی در نظر گرفته شود که یک معیار خاص جداپذیری را بیشینه کند، آنگاه واضح است که کاربردهای فراوانی خواهد داشت. بعضی تحقیقات تجربی نشان داده اند که تخطی از فرض نرمال بودن در LDA از کاربردهای موفق آن خیلی نمی کاهد (Hand , 1997).
تابع دسته بندی تولید شده به وسیله LDA و LR توابعی خطی از متغیرهای ورودی هستند. به اعتقاد بیشتر محققین، وابستگی خطی بودن17 متغیرهای ورودی تاثیر منفی روی نتایج این الگوریتم ها دارد.
(Feidicker , 1992; Hiehaus ,1987). وابستگی خطی در بین متغیرهای ورودی به معنی اینست که یک متغیر ترکیب خطی از بقیه متغیرها باشد. البته امکان دارد که متغیرهای ورودی از این حیث از پیش، مورد بررسی قرار گیرند و اطمینان حاصل شود که وابستگی قوی بین متغیرهای ورودی باقی مانده از مجموعه داده وجود ندارد.
از دیگر معایب LDA و LR می توان به این اشاره کرد که نمی توانند اثرات متقابل را در نظر بگیرند. اثر متقابل زمانی اتفاق می افتد که وابستگی بین یک متغیر و متغیر وابسته به مقدار دیگر متغیرها بستگی داشته باشد. برای حل این مشکل، متغیر با اثر متقابل که حاصلضرب دو یا چند متغیر است، در مدل نظر گرفته شود (Rosenberg , 1994).
یکی از الزامات شبکه های عصبی نرمال سازی متغیرهای ورودی است. متغیرهای ورودی ممکن است دارای مقیاس های متفاوت از مقادیر متفاوت باشند و از این رو تاثیر آنها روی خروجی بطور نامساوی لحاظ شود و از این رو به یک مدل منحرف منجر شود. بدین خاطر، مقادیر هر متغیر ورودی باید به یک مقیاس مشترک تبدیل شوند ( مثلاً بین 0 و1) (Krause,1993).
نظر متخصصین بر این است که عملکرد شبکه های عصبی (NN) ، درخت های تصمیم (DT) و روش های یادگیری مورد ـ مبنا (IBL) در مقایسه با روش های سنتی با نسبت مشتریان خوب و بد در مجموعه داده ارتباط دارد (Desai ,1997; Michie,1994). معمولاً احتمالات پیشین یکسان از موارد "خوب" و "بد" از نمونه های آموزشی می تواند عملکرد مدل را بهبود دهد. در مقابل، الگوریتم های آماری می تواند با این مطلب گلاویز شده و پس از آن نسبت های متفاوت کلاس ها در نمونه های آموزشی بخوبی برآیند.
(Michie,1994).
از مقایسه الزامات ورودی های پنج الگوریتم مطرح شده فوق می توان دید که نیازهای محدود کننده در روش های سنتی کاربردهای آنان را محدود می کنند (جدول 3-1) و در نتیجه کارهای پیش پردازش بیشتری هم برای آنها مورد نیاز است. در مقابل، روش های جدید (NN,DT,IBL) می توانند با فروض و یا نیازمندی های کم در داده های ورودی، دانش موجود در آنها را یاد بگیرند.
خروجی های مدل
خروجی روش های LDA و LR به شکل امتیاز می باشند. خروجی شبکه های عصبی می تواند هم امتیازات پیوسته و هم درجه عضویت در کلاس ها باشند که بر اساس هر کدام از این خروجی ها به آنها شبکه های دسته بندی و شبکه های امتیازدهی18 هم می گویند (Fritz , 1998).
خروجی های درخت تصمیم معمولاً درجه عضویت در کلاس ها است. روش درخت تصمیم با خروجی کلاس، مشتریان را در گروه هایی دسته بندی می کند که هر گروه دارای ویژگی های یکسان خوش حسابی یا بدحسابی است و از ویژگی های خوش حسابی و بدحسابی دیگر گروه ها متمایز است.
(Thomas,2000)
درخت های تصمیم می توانند پیش بینی عددی هم انجام دهند. برای مثال، الگوریتم C4.5 پیش بینی های پیوسته ای با توابع رگرسیون خطی در برگ ها بدست می آورد (Frank ,1998).
خروجی روش یادگیری مورد ـ مبنا می تواند امتیازات و کلاس ها باشند. روش k نزدیکترین همسایه، درجه عضویت کلاس ها را تولید می کند. در حالیکه رگرسیون محلی وزنی که برای پیش بینی عددی بکار می رود، دارای خروجی به شکل امتیازهای پیوسته است.
برای روشی که دارای خروجی به شکل امتیاز است، و تنها دو کلاس وجود داشته باشند برای انتخاب سطح مطلوب و متوازن بین مشتری خوش حساب و بدحساب باید یک مقدار آستانه تعیین گردد. این موضوع انعطاف پذیری در تصمیم گیری را بالا می برد. بر اساس نظر و سطح ریسک صاحب سرویس، لازم است که تصمیم گیرنده تنها مقدار آستانه را تغییر دهد. در مقابل روشی که خروجی آن درجه عضویت در کلاس است، با وجود اینکه برای فهم و بکارگیری ساده هستند ولی فاقد این انعطاف پذیری است. هنگامی که نظر صاحب سرویس و یا تصمیم گیرنده در مورد سطح ریسک و یا دیگر پارامترها عوض شود، این مدل ها باید از نو ساخته شوند.
جدول 3-1: مقایسه روش های دسته بندی
عملکرد در کاربردهای قبلی
این واقعیت را که تکنیک های جدید نظیر شبکه های عصبی می توانند روابط غیر خطی را کشف کنند؛ چیزی که تکنیک های سنتی قادر به آن نیستند، باید یک عملکرد برتر و یا مزیت محسوب کرد. اما، تعدادی مقایسات عمومی وجود دارند که این تکنیک ها را در زمینه رفتار مشتریان از حیث خوش حسابی و بدحسابی، اعتبار خوب و اعتبار بد مقایسه کرده اند ولی همه آنها برتری فوق را برای تکنیک های جدید قائل نشده اند. کارهای انجام شده نتایج مختلف و بعضاً متناقض را نشان می دهند.
بعضی از محققین ادعا کرده اند که تکنیک های قدیمی از تکنیک های جدید بهترند (Yobas , 2000). بعضی از نویسندگان دریافه اند که اختلاف اندکی بین دقت دسته بندی هر روش وجود دارد (Thomas ,2000;Hand,1997).
برای مثال یک تحقیق نشان می دهد که شبکه های عصبی در دسته بندی مشتریان با عملکرد بدمالی بهتر از LDA عمل می کنند (Desai,1997,1996). از سویی دیگر، تحقیقی دریافته است که موارد "بد" به وسیله تحلیل تمایزی بهتر تشخیص داده می شوند در حالیکه، موارد "خوب" با شبکه های عصبی بهتر دسته بندی می شوند R.Malhotra and D.K. Malhotra ,2002)).
زمانی که الگوریتم جدیدی ارائه می شود، سازنده آن برتری آن را با تجربه و آزمایش بر روی تعدادی داده های واقعی اثبات می کند. اما، اینکه این برتری در جاهای دیگر و با داده های متفاوت از قبلی حفظ شود، مساله ای قطعی نیست. بررسی های مقایسه ای نشان داده است که هیچ روشی نمی تواند هموار بهتر از بقیه باشد، بلکه برای یک سری داده های خاص یک یا چند الگوریتم بهینه و برتر ممکن است وجود داشته باشد.
عملکرد الگوریتم دسته بندی به این بستگی دارد که سازنده مدل چگونه با مجموعه داده ها رفتار می کند و چگونه آنها را بکار می گیرد. مثلاً چگونه متغیرهای درونی را انتخاب می کند، یا مقادیر گم شده چگونه برخورد می کند و اینکه چگونه سازنده مدل پارامترهای مدل را انتخاب می کند و غیره. برای انتخاب یک روش بهینه برای یک مجموعه داده خاص، این عوامل بخوبی باید در نظر گرفته شوند.

خلاصه و نتیجه گیری
در فصل سوم تکنیک ها و الگوریتم های مختلف دسته بندی مورد بررسی قرار گرفته اند. در این فصل ضمن اشاره به هر کدام از تکنیک ها، کاربردهای آنها برای مساله دسته بندی و تشخیص بدحسابی مورد اشاره قرار گرفت. دو تکنیک شبکه عصبی و درخت تصمیم که جزو ابزارهایی مورد استفاده در این تحقیق هستند، به تفصیل بیشتری آورده شده اند.
تکنیک ها و الگوریتم های معرفی شده از چند جنبه مهم با هم مقایسه شدند. همچنین به مزایا و معایب هر کدام اشاره گردید و مشخص شد که این تکنیک ها، علیرغم داشتن برتری های نسبی، هیچکدام همواره بر دیگری برتری ندارد و این نوع مساله است که نقش اساسی را در تعیین بهترین تکنیک یا الگوریتم دارد.
1 – تحلیل تمایزی دارای مجموعه ای از روش ها شامل تمایز خطی، نمایز کوادراتیک و تمایز لجستیک می باشد. فیشر تابع تمایز خطی دیگری نیز یافت که در حالتی که دو کلاس وجود داشت، دارای ضرایب یکسانی با قاعده تمایز خطی بیزی بود (Thomas , 2000)
2 – قضیه بیز:
3 – برای مساله دسته بندی مشتریان بدحساب در حالتی که بیش از 2 دسته مطرح باشد، محاسبه هزینه Lij مقداری غیر واقعی است.
4 . Linkelihood ratio
5 . Instance-Based Learning
6 . Manhattan distance
7 . Locally Weighted Regression (LWR)
8 .noise
9 . Hunt's CLS method
10 . Greedy algorithms
11 . gain
12 . entropy
13 . Three-layer feedforward network
14 . Identify transfer function
15 . Resilient Back propagation algorithm
16 . Multi Layer Perceprtone eith Back Propagation (MLP-BP)
17 . multi collinearity
18 . scoring network
—————

————————————————————

—————

————————————————————

86


تعداد صفحات : 85 | فرمت فایل : word

بلافاصله بعد از پرداخت لینک دانلود فعال می شود