تارا فایل

تحقیق توزیع نرمال چوله



دانشگاه
پایان نامه دوره کارشناسی رشته آمار
عنوان
توزیع نرمال چوله
استاد راهنما

گردآورندگان

آذرماه 87
تقدیر و تشکر
سپاس خدایی را که نعمت وجود را بر ما ارزانی داشت و بر ما منت گذارد و چشمانمان را به دنیای علم گشود تا بهترین راه شناخت را بر ما نشان دهد و یاریمان کرد که پا در راه دانش بگذاریم که او را با تمام ذرات وجودمان لمس کنیم. بی شک انجام این پایان نامه بدون یاری و مدد الهی ممکن نبود پس در اینجا مراتب سپاس و شکرگذاری خود را به درگاه او ابراز می داریم که به ما توفیق انجام این کار عنایت فرمود و بعد از لطف الهی از مساعدت ها و تلاش های بی شائبه سرکار خانم استاد زمان که ما را در انجام این پژوهش یاری فرمودند کمال تشکر و سپاسگذاری را داریم و از درگاه ایزد منان طول عمر همراه با سربلندی را برایشان مسئلت داریم.

تقدیم به
تکیه گاه و یاور همیشگی دلتنگی هایم، آن که آواز خوش صدایش دل و روح و جانم را نوازش می دهد و صدای نده ها و سخنانش بهار دل انگیز را تداعی می کند و چهره نورانی اش چراغ روشن خانه است.
پایان نامه ی خود را تقدیم به دو فرشته مهربان زندگیم (پدر و مادر) می نمایم تا شاید شکر یکی از هزاران خوبی آنها شود و سپاس خدای را که تشکر از آنها را قبل از خویش آورده است پس خود نگهدارشان باد.

فهرست مطالب
عنوان
صفحه
فصل اول: تعریف مفاهیم پایه

1-1 تعریف متغیر تصادفی

1-2 تابع توزیع

1-3 تابع چگالی احتمال

1-4 امید ریاضی

1-5 واریانس

1-6 تابع مولد گشتاور

1-7 تابع مشخصه

فصل دوم: معرفی توزیع نرمال چوله

2-1 تابع چگال نرمال چوله

2-2 متغیر تصادفی چوله

2-3 ویژگی های نرمال چوله

2-4 تابع توزیع نرمال چوله

2-5 ویژگی های نرمال چوله با استفاده از تابع توزیع آن

فصل سوم: تابع مولد گشتاور نرمال چوله

3-1 تابع مولد گشتاور نرمال چوله

3-2 میانگین و واریانس توزیع نرمال چوله

فصل چهارم: کاربرد تابع تشخیص نرمال چوله

4-1 تابع ممیزی

4-2 طریقه انجام شبیه سازی

4-3 آنالیز تصاویر سنجش از راه دور

4-4 نتیجه گیری

منابع

پیشگفتار
این پایان نامه برای آشنایی دانشجویان رشته ی آمار و سایر دانشجویان علاقه مند، با توزیع نرمال چوله تنظیم شده است.
این پروژه در کل شامل 4 فصل می باشد که در فصل اول به تعریف مفاهیم اساسی پرداخته شده و فصل دوم شامل معرفی توزیع نرمال چوله و فصل سوم تابع مولد گشتاور نرمال چوله و در فصل چهارم به کاربرد توزیع نرمال چوله پرداخته شده است.
توزیع نرمال یکی از مهمترین توزیع های آماری است که در هر دوی آمار نظری و کاربردی نقش کلیدی دارد. به ویژه اهمیت این توزیع در قضیه حد مرکزی آشکار می شود. براساس این قضیه، بسیاری از توزیع ها در حد توزیع نرمال گرایش می یابد. تنها تعداد محدودی خانواده توزیع های پارامتری وجود دارند که این توزیع را دقیقاً و نه در حد دربر می گیرند. در واقع، پیش فرض بسیاری از روش های آماری نرمال بودن توزیع جامعه می باشد. اما عملاً در بسیاری از مسائل روزمره و واقعی قبول چنین فرضی معقول به نظر را اگر چه توزیع جامعه ی داده ها به توزیع نرمال نزدیک است ولی برخلاف توزیع نرمال، آنها نوعاً نامتقارن و یا حتی دومدی هستند. در دهه های اخیر بررسی توزیع واقعی چنین جوامعی مورد توجه آماردانان قرار گرفته است و پیامد آن معرفی خانواده توزیع نرمال چوله و نرمال را نیز به عنوان حالت خاص در بر می گیرند. توزیع نرمال چوله دو تکه به ویژه به دلیل وجود اندک توزیع های دومدی رایج ممکن است در تشریح جوامع دو مدی عملاً سودمند باشد.

آذرماه 87

1-1 متغیر تصادفی
متغیرهای تصادفی تابعی است که به ازای هر عضو از فضای نمونه یک عدد حقیقی نسبت می دهد.

با توجه به وضع شمارایی فضای نمونه ای S، متغییر می تواند گسسته یا پیوسته باشد. اگر شما را باشد متغیر تصادفی گسسته و اگر ناشمارا باشد پیوسته خواهد بود.

1-1-1 متغیر تصادفی گسسته
مثال: وقتی سکه ای را می اندازیم، دو برآمد رو و پشت دارد. تابع را بدین صورت تعریف می کنیم که دامنه آن مجموعه با دو عضو پشت و رو و حوزه مقادیر (برد) آن دو عدد 0 و 1 از محور اعداد حقیقی باشد. یعنی:

اگر حوزه مقادیر (برد ) متناهی یا شمارا نامتناهی باشد، متغیر تصادفی را گسسته می گوییم. برای درک بهتر مطالب فرض کنید فضای نمونه ای را داریم، و احتمال هایی که به ترتیب به برآمدهای تخصیص داده ایم باشند، تابعی مانند را در نظر می گیریم که حوزه تعریف (دامنه) آن حوزه مقادیر آن نقاطی از محور اعداد حقیقی است، طوری که هر برآمد یا هر پیشامد با نقطه ای از محور مزبور متناظر باشد. در این صورت مطابق شکل:

تابع :متغیر تصادفی است و xk,…,x2,x1 مقادیر آن هستند.

شکل
تابع جرم احتمال
تابع جرم احتمال یک متغیر تصادفی گسسته ، تابعی است که به هر یک از مقادیر ، یعنی به هر یک از 1ها و احتمال را نسبت می دهد. به صورت جدول داریم:

xi x1 x2 … xk

pi p1 p2 … pk

بدیهی است که:
اگر نقاط به طول xk,…,x2,x1 را نقاطی مادی تلقی می کنیم، می توانیم را به ترتیب جرم این نقاط بگیریم. به همین دلیل رابطه را تابع جرم احتمال یا صرفاً تابع احتمال متغیر تصادفی می نامند. جدول بالا نشان می دهد که مقدار کل احتمال به چه ترتیب بین مقادیر متغیر توزیع شده است و آن جدول توزیع احتمال می گویند.
هر تابع احتمال مربوط به متغیر تصادفی گسسته دارای ویژگی های زیر است:
1)
2)
و اگر تابعی دارای دو ویژگی بالا باشد، یک تابع احتمال است.

1-1-2 متغیر تصادفی پیوسته
مثال: اگر بخواهیم زمان تاثیر یک ماده شیمیایی بر ماده دیگر را بررسی کنیم فضای نمونه ای را می توانیم مثلاً شامل تمام لحظات زمانی غیرقابل تفکیک از هم بین 10 دقیقه تا 15 دقیق بگیریم. در صورتی که زمان را روی محور اعداد حقیقی ببریم فضای نمونه ای مرکب از تمام نقاط بین 10 تا 15 روی این محورند که فضایی پیوسته است. اگر تابعی از S بر مجموعه باشد به ازای هر ، می توان نوشت:

پیشامدی است متشکل از آن نقاط فضای S که هر یک از آنها تحت تابع از عدد حقیقی x کوچکتر یا با آن مساوی است. اگر این پیشامد را با نشان دهیم واضح است که

بدیهی است که این مقدار به بستگی دارد و با تغییر روی محور حقیقی ، تابع را می سازد. این تابع ویژگی های تابع توزیع را دارا است.
اگر تابع ی که چنین بنا کردیم تابعی پیوسته باشد تابع را یک متغیر تصادفی پیوسته می نامیم.

1-2 تابع توزیع
توابع توزیع اساس نظریه آمار و احتمال را تشکیل می دهند و در آمار توصیفی عموماً فراوانی نسبی را به عنوان برآورد احتمال یک پیشامد در نظر می گیرند اگر در آزمایش بار مقدار کمتر یا مساوی مشاهده شود یک برآورد عبارت زیر است:

و اگر گسسته باشد و تعداد دفعاتی باشد که مقدار را اختیار کرده است آنگاه:

1-2-1 ویژگی های توابع توزیع
اگر یک م.ت بر فضای احتمال باشد برای تعریف می کنیم

اگر داشته باشیم هر یک دیگری را نتیجه می دهند
مثال: اگر آنگاه

همانطور که می بینید تابع توزیع گسسته بالا تابع توزیع دو جمله ای است که در نقطه 0 جهشی به اندازه و در نقطه 1 جهشی به اندازه دارد.

نکته: اگر در جهشی به اندازه واحد داشته باشیم تابع توزیع م.ت تباهیده است.
قضیه: تابع توزیع متغیر تصادفی تابعی است نانزولی از راست پیوسته با و برعکس: هر تابع با خواص فوق تابع توزیع یک متغیر تصادفی بر یک فضای احتمال است.
اثبات: به ازای

چون در نتیجه داریم که نتیجه می دهد یکنوای نانزولی است.

برای پیوستگی:
دنباله را در نظر می گیریم می دانیم که اگر آنگاه پس داریم که اگر

چون این حکم برای هر دنباله برقرار است از راست پیوسته است.
فرض کنید در این صورت

بنابراین
حال اگر آنگاه

برعکس: داشتیم که هر تابع یکنوای نانزولی روی با و با یک اندازه لبک استیلجس متناظر است که آن را می توان به عنوان اندازه احتمال بر در نظر گرفت بر یک بازه داریم:
با فرض وکه در بالا تعریف شده است را می توانیم به عنوان ت.ت یک متغیر تصادفی که بر تعریف شده است در نظر بگیریم به قسمی که برای هر این تابع همانی هما متغیر تصادفی مطلوب است.

1-2-2 تعریف دیگر تابع توزیع
اگر آنگاه وقتی عبارت

به سمت صفر میل می کند که در نتیجه از چپ پیوسته است این تابع نیز تمام خواص را داراست جز آنکه از چپ پیوسته است در صورتیکه از راست پیوسته است.

نکته: اگر در یک نقطه انفصال مانند و را بصورت تعریف کنیم آنگاه تابع نه از راست و نه از چپ پیوسته خواهد بود.
نکته: چون وقتی اگر باشد تابع در پیوسته خواهد بود در این حالت نیز در پیوسته است اگر باشد آنگاه توابع و در جهشی به اندازه خواهند داشت توابع و در تمام نقاط پیوستگی مساوی خواهند بود و در نقطه انفصال تابع یا مانند داریم.

1-3 تابع چگالی احتمال
در آمار و احتمالات تابع چگالی احتمال به تابعی اطلاق می شود که توزیعی آمار را به شکل انتگرالی نمایش دهد. این تابع، تابعی است غیرمنفی و احتمال آنکه متغیر تصادفی که از این توزیع پیروی می کند در بازه واقع شود از رابطه زیر بدست می آید:

همچنین کل مساحت زیر نمودار برابر است با 1؛ یعنی:

1-3-1 ویژگی های تابع چگالی
1. چون مشتق است و نانزولی است، پس .
2.
یعنی کل مساحت سطح محصور بین خم تابع و محور ها برابر 1 است.
3. معرف یک احتمال نیست و به سادگی می توان دید که ،وقتی متغیر تصادفی پیوسته است، برابر0 است.
بنابراین وقتی متغیری پیوسته است.

زیرا
مثال: متغیر تصادفی را دارای توزیع دو جمله ای گوئیم اگر تابع چگالی گسسته به صورت زیر باشد:
برای
که در آن ، و اعداد صحیح مثبت را اختیار می کند.
نشان دهید متغیر تصادفی دارای توزیع نرمال است اگر تابع چگالی آن به صورت باشد.
باید نشان دهیم که دارای خواص تابع چگالی است.
اولاً همه جا مثبت است و تنها به ازای به صفر میل می کند.
ثانیاً است. زیرا

اگر قرار دهیم ، با توجه به برابری داریم

با توجه به تقارن، ، پس

اگر قرار دهیم ، با توجه به و و شرط ، داریم

انتگرال طرف دوم است که مساوی است پس .

1-4 امید ریاضی
مفهوم امید ریاضی، در اصل در ارتباط با بازی های شانسی بوجود آمده است و در ساده ترین صورتش حاصل ضرب مبلغی است که بازیکن امکان برد آن را در احتمال آنکه برنده شود. در واقع امید ریاضی یک میانگین است. یا همان مقدار مورد انتظار یک متغیر تصادفی می باشد.
اگر یک متغیر تصادفی گسسته و ومقدار توزیع احتمال آن به ازای x باشد، مقدار مورد انتظار برابر است با

به همین ترتیب اگر یک متغیر تصادفی پیوسته و مقدار چگالی احتمال آن به ازای x باشد، مقدار مورد انتظار برابر است با:

در بسیاری از مسائل آمار، نه تنها مقدار مورد انتشار یک متغیر تصادفی ، بلکه مقادیر مورد انتظار متغیرهای تصادفی وابسته به نیز مورد توجه اند. مثلاً ممکن است متغیر تصادفی مورد توجه ما باشد که مقادیرش با مقادیر از طریق معادله در ارتباط اند. برای مثال ممکن است باشد. بنابراین حرف قرار گرفته داخل پرانتز در تعریف ممکن است برحسب نیاز ما متفاوت باشد. تعیین امیدهای ریاضی را اغلب می توان با استفاده از قضایای زیر ساده کرد. این قضایا ما را قادر می سازد که مقادیر امید را از روی امیدهای دیگری که معلوم اند و یا براحتی قابل محاسبه اند حساب کرد.

1-4-1 ویژگی های امید ریاضی
1. در حالت خاص اگر باشد که در آن، a مقداری ثابت است، به سهولت نتیجه می شود که زیرا

2. به همین صورت نتیجه می شود که که در آن، a مقدار ثابت است.
3.اگر دو تابع باشد که روی تعریف شده اند، داریم

مثال1: اگر متغیر تصادفی دارای توزیع دوجمله ای باشد، امید ریاضی آن را حساب کنید.

اگر را در فاکتور قرار دهیم

داخل کروشه، بسط است. پس

مثال2: اگر متغیر تصادفی دارای توزیع نرمال باشد، امید ریاضی آن را حساب کنید.

1-5 واریانس
در نظریه احتمالات و آمار واریانس نوعی سنجش پراکندگی است.
مقدار واریانس با میانگین گیری از مربع فاصله مقدار محتمل و یا مشاهده شده با مقدار مورد انتظار محاسبه می شود. در مقایسه با میانگین می توان گفت که میانگین مکان توزیع را نشان می دهد، در حالی که واریانس مقیاسی است که نشان می دهد که داده ها حول میانگین چگونه پخش شده اند. واریانس کمتر بدین معنا است که انتظار می رود که اگر نمونه ای از توزیع مزبور انتخاب شود مقدار آن به میانگین نزدیک باشد. یکای واریانس مربع یکای کمیت اولیه می باشد. ریشه دوم واریانس که انحراف معیار نامیده می شود دارای واحدی یکسان با متغیر اولیه است.
گشتاور مرکزی مرتبه دوم، μ، را واریانس متغیر تصادفی می نامند. و آن را با و یا نشان می دهند.

زیرا

و با توجه به ویژگی های امید ریاضی،

پس مقدار مثبت یا صفر است و جذر مثبت آن را با نشان می دهیم.

1-5-1 ویژگی های واریانس

مثال: اگر دارای توزیع دوجمله ای باشد. واریانس آن را محاسبه کنید.
با استفاده از تابع مولد گشتاور، واریانس را پیدا می کنیم.

را در قسمت امید ریاضی محاسبه کردیم که

که در آن:

اگر دارای توزیع نرمال باشد. واریانس آن را محاسبه کنید؟

1-6 تابع مولد گشتاور
تابع مولد گشتاور یا تابع مولد ممان یا ام جی اف1 تابع پرمصرف در ریاضیات آمار و احتمالات است. با داشتن تابع مولد ممان یک متغیر تصادفی می توان توزیع احتمالی آن را بطور کامل تعریف نمود.
بنا بر تعریف، تابع مولد ممان برای متغیر تصادفی بصورت زیر تعریف می گردد:

و تابع مولد ممان برای زمانی موجود خواهد بود که ثابتی مثل b موجود باشد بگونه ای که محدود برای بازه باشد.

1-6-1 تابع مولد گشتاور متغیر تصادفی گسسته
برای احتراز از محاسبات طولانی در تعیین میانگین و واریانس و به طور کلی گشتاورهای یک متغیر تصادفی گسسته، می توانیم از تابع مولد گشتاورهای متغیر تصادفی استفاده کنیم. تابعی که به صورت:

تعریف می شود به تابع مولد گشتاورهای متغیر تصادفی y موسوم است.
مثال: اگر دارای توزیع دوجمله ای باشد، تابع مولد گشتاور آن را محاسبه کنید.

1-6-2 تابع مولد گشتاور متغیر تصادفی پیوسته
تابع مولد گشتاورهای متغیر تصادفی پیوسته که تابع چگالی آن است به صورت زیر تعریف می شود.

اگر عبارت داخل کروشه را مربع کامل کنیم، داریم:

پس داریم:

حاصل انتگرال همراه با ضریب لزوماً یک است زیرا برابر سطح زیر نمودار توزیع نرمال با میانگین و واریانس است. بنابراین

1-6-3 ویژگی تابع مولد گشتاور
یکی از ویژگی های مهم تابع مولد گشتاورها این است که متغیرها چه گسسته باشند و چه پیوسته، تابع مولد گشتاورهای مجموع دو یا چند متغیر تصادفی مستقل، برابر حاصلضرب توابع مولد گشتاورهای آن متغیر است. فرض کنید دو متغیر تصادفی مستقل باشند که تابع های مولد گشتاور آنها به ترتیب و هستند در این صورت که تابع مولد گشتاورهای متغیر تصادفی جدید است طبق تعریف به صورت:

اما چون از هم مستقل اند ناگزیر و نیز از هم مستقل اند و لذا

1-6-4 کاربرد تابع مولد گشتاور
گشتاورهای یک متغیر تصادفی را می توان به سادگی از طریق تابع مولد گشتاور و بدون نیاز به انتگرال گیری بدست آورد:

1-7 تابع مشخصه
فرض کنید تابع توزیع یک متغیر تصادفی باشد با دو خاصیت: و به تابع توزیع تابعی با مقادیر مختلط به صورت زیر نسبت می دهیم که تابع مشخصه ی نام دارد.

از آنجائیکه:

مثال1: فرض کنید دارای چگالی نرمال استاندارد باشد.

مثال2: فرض کنید دارای توزیع دوجمله ای باشد.

نکته: اگر تابع مشخصه باشد تابع مشخصه نیز می باشد. به دلیل زیر:

1-7-1 ویژگی های تابع مشخصه
قضیه: اگر تابع مشخصه یک متغیر تصادفی کلی مانند باشد، آنگاه:
الف) پیوسته است.
ب)

که مزدوج مختلط است.
ج) اگر تابع مشخصه باشد، تابع مشخصه برابر است و تابع مشخصه است. حقیقی است اگر و فقط اگر نسبت به مبدا قرینه باشد.
د) اگر ها توابع مشخصه باشند، نیز تابع مشخصه است اگر

برهان:
الف) کافی است نشان دهیم که:

در نتیجه پیوسته است.
ب)

ج)

د) حقیقی است اگر و فقط اگر نسبت به مبدا متقارن است.
ابتدا فرض می کنیم که نسبت به مبدا متقارن است. در نتیجه داریم:

در نتیجه، حقیقی است.
حال، عکس قضیه. فرض می کنیم حقیقی باشد. در نتیجه داریم:

در نتیجه، نسبت به مبدا متقارن است.

د) برای این قسمت کافی است را بصورت زیر در نظر بگیریم:

که ها تابع مشخصه هستند. در نتیجه تابع مشخصه است.
مثال1: با توجه به اینکه می دانیم تابع مشخصه توزیع نرمال استاندارد بصورت است، می توانیم تابع مشخصه توزیع نرمال با میانگین و واریانس را بیابیم.

نکته: اگر در نتیجه داریم: . ولی عکس است حالت برقرار نیست. یعنی اگر باشد، نمی توانیم نتیجه بگیریم که است.
برای مثال در توزیع دوجمله ای داریم:

چند نامساوی:
لم1: برای هر تابع مشخصه مانند داریم:
الف)

ب)

ج)

که در آنها جزء حقیقی است.
اثبات:
الف)

ب)

ج)

لم2: فرض کنید مجموعه هایی دلخواه از اعداد حقیقی باشند. در اینصورت برای هر تابع h (حقیقی یا مختلط) که بر این مجموعه تعریف شده باشد، داریم:

اثبات:

2-1 تابع چگالی نرمال چوله
اکثر توزیع هایی که در طبیعت وجود دارند نرمال نیستند به عبارتی چوله اند، اما تمایل به سمت نرمال شدن را دارند.
آزالینی2 در سال 1985 خانواده ای از تابع چگالی با نام توزیع نرمال چوله3 را معرفی کرد که این تابع چگالی به شکل پارامتر λ بستگی دارد به قسمتی که برای توزیع نرمال استاندارد بدست می آید.
برای معرفی این توزیع جدید ابتدا لم زیر را ثابت می کنیم که این لم نقطه شروع برای تعریف نرمال چوله است.
لم1: f را به عنوان تابع چگالی متقارن حول صفر و را تابع توزیع پیوسته به قسمتی که متقارن حول صفر باشد، را در نظر می گیریم آنگاه:
(1)
یک تابع چگالی است.
اثبات:
متغیرهای تصادفی و مستقل را با چگالی (به ترتیب) در نظر می گیریم.
یادآوری:
اگر
بنابراین متقارن حول صفر است.

نشان دادیم که تابع موردنظر یک تابع چگالی است.

تکنیک رد-پذیرش4
تکنیک رد-پذیرش برای تولید متغیر تصادفی از چگالی (1) بصورت زیر بیان می شود.
نمونه از و از را در نظر می گیریم. اگر آنگاه خروجی بصورت در غیر اینصورت نمونه گیری تکرار می شود و جفت متغیرهای () جدید را تولید می کنیم تا اینکه نامساوی بالا برقرار شود.

اشکال (2-2-1) و (2-2-2) نمودار چگالی نرمال چوله را به ازای مقادیر مختلف نشان می دهد .

شکل (2-2-1): چگالی نرمال چوله برای (خط تیره)، (نقطه چین) و (خط فاصله).

شکل(2-2-2) : چگالی نرمال چوله برای (خط تیره)، (نقطه چین) و (خط فاصله).
2-2 تعریف متغیر تصادفی نرمال چوله
اگر متغیر تصادفی تابع چگالی بصورت
2)
داشته باشد، که در آن به ترتیب تابع چگالی و تابع توزیع نرمال استاندارد باشند، در آنصورت گوییم یک متغیر تصادفی نرمال چوله با پارامتر λ است و بصورت نشان می دهیم.
به استاندارد لم (1) این تابع، یک تابع چگالی است.
کافیست در لم (1) قرار دهیم در نتیجه تابع معرفی شده یک تابع چگالی می شود.
قضیه1: اگر یک متغیر تصادفی با چگالی دارای چگالی (1) باشد، آنگاه دارای چگالی یکسان اند.
اثبات:

قضیه2: تحت شرایط لم (1)، را متغیر تصادفی با چگالی را بصورت زیر تعریف می کنیم آنگاه دارای چگالی (1) است.

اثبات:

قضیه3: تحت شرایط قضیه (2) اگر و تعریف مشابه داشته باشد و متغیر تصادفی بصورت زیر تعریف شود، آنگاه دارای چگالی (1) است.

اثبات:

حالت اول

حالت دوم

قضیه (2)و(3) روشی برای تولید چگالی (1) ارائه می دهد که این روش چندین برابر کاراتر از روش رد-پذیرش.

بطور کلی: متغیرهای از و از و خروجی بصورت:

قضیه4: اگر متغیرهای تصادفی مستقل و همتوزیع با باشند آنگاه

اثبات1:

اثبات2:

اثبات3:

حال نشان می دهیم که

راه حل دوم برای اثبات 1و2

دو حالت برای رخ می دهد.

حال چگالی توام را بدست می آوریم و با استفاده از آن چگالی حاشیه ای هر کدام را محاسبه می کنیم.

این قضیه نشان می دهد که آماره های ترتیبی یک نمونه تصادفی به اندازه 2 از توزیع نرمال استاندارد، دارای توزیع نرمال چوله اند.(از توزیع نرمال چوله پیروی می کنند.)

2-3 ویژگی های نرمال چوله
1. اثبات:
2.

اثبات:
حالت 1) اگر

حالت2) اگر

3.
اثبات:

4. چگالی نرمال چوله قویاً تک مدی5 است یعنی تابع مقعری از است.
اثبات:
کافیست نشان دهیم که مشتق دوم این تابع منفی است.
در حالت کلی داریم: برای تابع یک تابع مقعری از است زیرا:

از طرفی می دانیم که (تابع چگالی است)
بنابراین تابع مقعری از است.

5.
اثبات:

2-4 تابع توزیع نرمال چوله
تابع توزیع نرمال چوله را با نشان می دهیم و آن را بصورت زیر تعریف می کنیم:

با تغییر ناحیه انتگرال گیری این تابع توزیع را می توان بصورت زیر هم تعریف کرد.

که در آن یک تابع نزولی از می باشد.
برخی ویژگی های تابع

حال ثابت می کنیم که
در عبارت سمت چپ جمله اول را بصورت مجموع دوجمله می نویسیم:

2-5 ویژگی های نرمال چوله با استفاده از تابع توزیع آن
1.
اثبات:

2.
اثبات:

نشان می دهیم که
اثبات:

3.
اثبات:

تابع نزولی از است بنابراین sup مقدار در نقطه ابتدایی دامنه رخ می دهد یعنی در نقطه بنابراین کافیست مقدار را محاسبه کنیم.

3-1 تابع مولد گشتاور نرمال چوله
در این فصل تابع مولد گشتاور توزیع نرمال چوله را مورد بررسی قرار می دهیم.
قضیه: اگر آنگاه تابع مولد گشتاور آن بصورت زیر می باشد.

که در آن می باشد.
اثبات:

با توجه به تابع مولد می توانیم میانگین و واریانس توزیع را بدست آوریم.

3-2 میانگین و واریانس توزیع نرمال چوله
1.

اثبات:

2.

اثبات:

را می توان بصورت زیر نیز محاسبه کرد. (علاوه بر اینکه می دانیم گشتاورهای زوج نرمال چوله و نرمال استاندارد یکسان اند).

اگر و مستقل از باشد آنگاه تابع مولد گشتاور عبارت است از:

اثبات:

اگر و و مستقل از باشد.
آنگاه دارای توزیع است.
اثبات:

تحلیل ممیزی6، یکی از روش های چند متغیری است که ایده اساسی آن، انتساب یک یا چند مشاهده جدید به یکی از جوامع متمایز، براساس مشاهدات اخذ شده از نمونه است. معمولاً هنگام به کاربردن تابع تشخیص، توزیع جامعه های مورد بررسی، نرمال فرض می شود و به استناد قاعده ممیزی بهینه بیز، از توابع تشخیص مشهور LDF7 (تابع تشخیص خطی نرمال) و QDF8 (تابع تشخیص درجه دوم نرمال) استفاده می شود.
در عمل، حالات واقعی زیادی وجود دارد که داده ها از توزیع چند متغیری نرمال و غیرنرمال (نزدیک به نرمال) پیروی می کند. به طور مثال در کلاس بندی تصاویر ماهواره ای9 و تصاویر هواپیمایی10 در سنجش از راه دور11، تصاویر دارای پوشش های مختلفی می باشند که بعضی از آنها دارای توزیع چند متغیری نرمال و بقیه نزدیک به نرمال هستند. فیکس و هاگ12 (1951)، کوپر13 (1963)، آندرسن14 (1972)، لاچنبرانچ15 (1973)، و ریپلی16 (1996) روش های ممیزی برای جوامع دارای توزیع غیرنرمال را، بررسی نمودند.
تابع تشخیص خطی نرمال و تابع تشخیص درجه دوم نرمال، دو تابع ممیزی متداول برای کلاس بندی تصاویر ماهواره ای هستند که در اکثر نرم افزارهای سنجش از راه دور مانند ERDAS و ENVI، از این دو تابع، برای انجام عملیات ممیزی استفاده می شود17. در این فصل به بررسی تابع تشخیص برای جوامع دارای توزیع نرمال و غیرنرمال (نرمال چوله) پرداخته شده است و خطای کلاس بندی آن با توابع تشخیص LDF و QDF مقایسه شده است. در ادامه این فصل در بخش دوم، به معرفی توابع تشخیص LDF و QDF و تابع تشخیص نرمال چوله پرداخته و در بخش سوم، روش انجام شبیه سازی مونت کارلو برای مقایسه توابع تشخیص مطرح گردیده و در بخش چهارم، نتایج شبیه سازی و سپس نتیجه گیری بیان شده است.

4-1 تابع ممیزی
فرض کنیم یک مشاهده متغیری باشد که متعلق به یکی از جوامع یا باشد. اگر تابع چگالی دو جامعه به ترتیب و باشد، آنگاه طبق قاعده ممیزی بهینه بیز خواهیم داشت:
متعلق به جامعه است اگر:
متعلق به جامعه است اگر:
که و احتمالات پیشین جوامع می باشند. اگر باشد، قاعده ممیزی بهینه بیز با تابع تشخیص مبتنی بر قاعده درست نمایی به طور یکسان عمل می کنند.
اگر هر دو جامعه از توزیع چند متغیری نرمال با میانگین های و ماتریس کوواریانس مشترک پیروی کنند، تابع تشخیص خطی نرمال براساس قاعده درست نمایی ماکزیمم به صورت زیر حاصل می گردد.

در عمل معمولاً میانگینو ماتریس کوواریانس مشترک مجهول می باشند، بدین خاطر برآوردهای درست نمایی ماکزیمم آن را جایگذاری می کنند.

اگر ماتریس کوواریانس دو جامعه با هم برابر نباشد و به ترتیب باشد، تابع تشخیص درجه دوم بر اساس قاعده درست نمایی ماکزیمم به فرم زیر حاصل می گردد.

در عمل معمولاً میانگین ها و ماتریس کوواریانس های دو جامعه مجهول می باشند، بدین خاطر برآوردهای درست نمایی ماکزیمم پارامترها را جایگذاری می کنند.
در سال 1985 توسط آزاالینی18، توزیع چند متغیری نرمال چوله با تابع چگالی زیر معرفی شد.

که تابع چگالی نرمال متغیری و تابع توزیع نرمال استاندارد است،را پارامتر محلی،را پارامتر مکانی (ماتریس کوواریانس) و را بردار چولگی می نامند، همچنینماتریس قطری با درایه های مثبت است.
در تابع چگالی چند متغیری نرمال چوله، اگر بردار چولگی برابر با بردار صفر در نظر گرفته شود، تابع چگالی چند متغیری نرمال چوله به تابع چگالی چند متغیری نرمال تبدیل خواهد شد (اثبات: فصل 2)
برآورد پارامترهای توزیع چند متغیری نرمال چوله، از روش EM محاسبه می گردد. برای محاسبه برآورد پارامترها، می توان از نرم افزار آماری و بسته نرم افزاری SN از سایت علمی CRAN19 بارگذاری می شود، استفاده کرد.
قضیه: با استفاد از قاعده ممیزی بهیه بیز، تابع تشخیص برای دو جامعه دارای توزیع چند متغیری نرمال چوله، با میانگین های متفاوت ، ماتریس کوواریانس مشترک و بردار چولگی مشترک به صورت زیر حاصل می گردد.

که:

تابع تشخیص فوق غیرخطی بوده که در همین حالت، احتمال کلاس بندی اشتباه تابع تشخیص نرمال چوله از احتمال کلاس بندی اشتباه تابع تشخیص خطی نرمال کمتر است.
در برتری تابع تشخیص نرمال چوله نسبت به LDF، می توان نتیجه گرفت که اگر، داده ها از توزیع چند متغیری نرمال پیروی کند، LDF و تابع تشخیص نرمال چوله شبیه به هم عمل می کنند و اگر داده ها از توزیع نرمال چوله پیروی کند، تابع تشخیص نرمال چوله نسبت به LDF دارای کلاس بندی اشتباه کمتری است.
قضیه: تابع تشخیص برای دو جامعه دارای توزیع چند متغیری نرمال چوله با پارامترهای محلی ، ماتریس کوواریانس و بردار چولگی به فرم زیر خواهد بود.
که:

در عمل معمولاً پارامترهای محلی ، ماتریس کوواریانس و بردار چولگی مجهولند و به جای آنها، از برآورد پارامترها استفاده می گردد.

2-4 طریقه انجام شبیه سازی
برای مقایسه بین تابع تشخیص نرمال چوله با LDF و QDF دو حالت در نظر می گیریم.
الف) مقایسه تابع تشخیص نرمال چوله با LDF در حال میانگین های متفاوت، ماتریس کوواریانس برابر و پارامتر چولگی نابرابر برای دو جامعه نرمال چوله.
ب) مقایسه تابع تشخیص نرمال چوله با QDF در حالت میانگین های متقاوت، ماتریس کوواریانس نابرابر و پارامتر چولگی نابرابر برای دو جامعه نرمال چوله.
برای انجام شبیه سازی از نرم افزار استفاده می کنیم. ابتدا دو جامعه متغیری نرمال که ، با چولگی های متفاوت تولید می کنیم. به کمک این داده ها و برآوردهای حاصل از این داده ها، تابع تشخیص را برآورد می کنیم، مجدداً دو نمونه دیگر با همان پارامترهای قبلی تولید کرده و از این دو نمونه، به عنوان نمونه آزمون استفاده می کنیم، داده های دو نمونه آزمون را به کمک تابع تشخیص بدست آمده، به دو جامعه انتساب داده و سپس مقدار خطای کلاس بندی اشتباه را ثبت می کنیم. این فرآیند را 100000 بار تکرار می کنیم و آزمون می کنیم که آیا خطای کلاس بندی تابع تشخیص نرمال چوله از خطای تابع تشخیص خطی و درجه دوم (LDF و QDF) کمتر می باشد یا خیر؟
برنامه کامپیوتری شبیه سازی فوق نوشته شده و از بسته های نرم افزاری متعددی مانند MASS، NLME، GRID و … استفاده شده است که با مراجعه به سایت اینترنتی CRAN می توان این بسته های نرم افزاری را بارگذاری کرد.

4-3 آنالیز تصاویر سنجش از راه دور
(1987)Kershaw، (1988)Glasbary و (1993)Ali تابع تشخیص برای جوامع غیرنرمال در سنجش از راه دور را بررسی نمودند. در این فصل نیز با ارائه یک تابع تشخیص جدید، سعی در بهبود کیفیت تصویرهای ماهواره ای یا کاهش خطای کلاس بندی تصاویر ماهواره ای داریم. با مشاهده نتایج شبیه سازی شده مونت کارلو بدین نتیجه می رسیم که میانگین احتمال خطای کلاس بندی تابع تشخیص نرمال چوله با LDF و QDF تفاوت معنی داری را نشان می دهد و میانگین احتمال خطای کلاس بندی تابع تشخیص نرمال چوله از میانگین احتمال خطای کلاس بندی LDF و QDF کمتر است. نتایج مقایسه فوق در جدول 1 و جدول 2 آمده است.

جدول1: نتایج مقایسه آنالیز تشخیص نرمال چوله با LDF
P مقدار
میانگین احتمال رده بندی نادرست قاعده تشخیص ببزی گوسی چوله
میانگین احتمال رده بندی نادرست LDF
k
211/0
2605/0
2752/0
2
176/0
2737/0
2944/0
3
213/0
2432/0
2667/0
4
189/0
2231/0
2573/0
5
310/0
2454/0
2531/0
7

جدول1: نتایج مقایسه آنالیز تشخیص نرمال چوله با QDF
P مقدار
میانگین احتمال رده بندی نادرست قاعده تشخیص ببزی گوسی چوله
میانگین احتمال رده بندی نادرست LDF
k
142/0
2904/0
3015/0
2
231/0
2643/0
2757/0
3
173/0
2494/0
2696/0
4
167/0
2401/0
2494/0
5
244/0
2212/0
2379/0
7

اولین ستون در جدول 1 نشان دهنده تعداد متغیرها است که در سنجش از راه دور معادل با تعداد باندها می باشد، ستون دوم میانگین احتمال رده بندی نادرست تابع ممیزی خطی نرمال برای 100000 بار تکرار از آزمایش شبیه سازی شده است و ستون سوم میانگین احتمال رده بندی نادرست تابع ممیزی نرمال چوله برای حالت فوق می باشد. در هر سطر از جدول 1، آزمون برتری میانگین احتمال رده بندی نادرست LDF در برابر میانگین احتمال رده بندی نادرست تابع تشخیص نرمال چوله در حالت زوج شده انجام شده است که در ستون آخر جدول 1، مقدار این آزمون آمده است که نشان دهنده برتری تابع تشخیص نرمال چوله نسبت به LDF است. نتایج حاصل از جدول 2 نیز مانند نتایج اخذ شده از جدول 1 است.

4-4 نتیجه گیری
در این فصل با شبیه سازی مونت کارلو نشان دادیم که خطای کلاس بندی تابع تشخیص نرمال چوله از خطای کلاس بندی LDF و QDF کمتر است. اگر داده های ماتریس های تصاویر، واقعاً از توزیع چند متغیری نرمال پیروی کند، تابع تشخیص نرمال چوله دقیقاً شبیه به LDF و QDF عمل می کند و اگر داده های ماتریس های تصاویر، از توزیع نزدیک به توزیع چند متغیری نرمال (توزیع چند متغیره نرمال چوله) پیروی کند، تابع تشخیص نرمال چوله بهتر از LDF و QDF عمل می کند. از آنجا که در کلاس بندی تصاویر ماهواره ای و تصاویر هواپیمایی در سنجش از راه دور، تصاویر دارای پوشش های مختلفی می باشند که بعضی از آنها دارای توزیع چند متغیری نرمال و بقیه نزدیک به نرمال (نرمال چوله) هستند، بهتر است در نرم افزارهای سنجش از راه دور به جای استفاده از توابع تشخیص LDF و QDF از توابع تشخیص نرمال چوله استفاده کنند، تا تصاویر با خطای کلاس بندی کمتری حاصل گردد.

منابع
1. تالیف: دکتر علی عمیدی. احتمال و کاربرد آن
2. الکساندرم.مود، فرانکلین آ.گریبیل،دون س.بوز. مقدمه ای بر نظریه آمار
3. تالیف: احمد پارسیان. مبانی آمار ریاضی
4. تالیف: گوری کی.باتاچاریا.ریچاردای.جانسون. مفاهیم و روش های آماری 1و2
5. www.viki pedia.com
6. www.civilica.com
Box, G.E.P.(1953). A note on regions of kurtosis. Biometrika 40,465-468.
Buurridge, J.(1981).A note on maximum likelihood estimation for regression models using grouped data. J.R. Statist. Soc. B 40, 41-45.
Hill, I.D.(1978).Remark ASR 26.Appl. Statist 27,379.
Hoaglin, P.(1982).g- ind h-distributions.In Encyclopedia of statistical sciences (ed. N. Johnson & S. Kotz), Wiley, New Yotk.
O'Hagan, A. & Leonard, T.(1976). Bayes estimation subject to uncertainty about parameters con straints.Biometrika 63, 201-202.
Owen, D.B.(1956). Tables for computing bivariate normal probabilities. Ann. Math. Statist. 27, 1075-1090.
Prentice, R.L.(1975). Discrimination among some parametric models.Biometrika 62, 607-614.
Thomas, G.E.(1979). Remark ASR 30. Appl. Statist. 28, 113.
Turner, M.E.(1960). On beuristic estimation methods. Bioinetrics 16, 299-401.
Vianelli, S.(1963).Lamisura di variabilita condizionata in uno schema generale delle curve normali di frequenza. Statistica 23, 447-473.
Young, J.C. & Minder, Ch.E. (1974). Algorithm AS 76: an integral useful in computing non-central and bivariate normal probabilities. Appl.Statist.23, 455-457.
Zacks, S.(1981). Parametric statistical inference. Pergamon Press, Oxford.
Received September 1984, in final form February 1985.
A.Azzzalini, Universita di Padova, Dipartimento di Scienze Statistich e, Via S. Francesco 33,35121.
روحانی مهدی، زادکرمی محمدرضا، (1383). تحلیل ممیزی گوسی چوله. سی و پنجمین کنفرانس ریاضی ایران، دانشگاه شهید چمران اهواز.
Anderson, T.W.(1984)."An imtrodection to Multiate Stetistical Methods". (2nd. Ed, Newyork, Jhon Wiley.
Azzalini, A. and Capitanio, A.(1998). "Statisical application of the multivariate skew-normal distribution".J.Roy.statist. soc. Series B. vol. 61. no3.
Ali, Q.M.(1993). "Statistical classification techniques in the analysis of remotely sensed images". Thesis of university of oxford, oxford, U.K.
Glasbery, C.A.(1998). "Normal distribution assumptions in discrimination". Proc. Of IGARSS'88 symposium, Ebinburgh, Scotland, 1789-1791.
Kershaw, C.D.(1987). "Discrimination problem for satellite image". International journal of remote sensing, 8,1377-1383.
Lachenbruch, P.A.(1973. "Robustness of the linear and quadratic discrimination function to certain types of non-normality". Commun.statist.,1(1),39-56.
Ripley, B.D.(1996). "Pattern Recogintion ind Neural Networks". Combridge University Press.
1 . Moment-generating function
2 Azzalini
3 Skew-normal distribution
4 Acceptance-rejection
5 .unimodal
6. Discriminant Analysis
7. Linear Discriminant Analysis
8. Quadratice Discriminant Anlysis
9. Satellite Image
10. Airborne Image
11. Remote Seensing
12. Fix & Hadges
13. Copper
14. Anderson
15. Lachenbranch
16. Ripley
17 . با مراجعه به Help نرم افزار
18. Azzalini
19. Http://cran.r-project.org/bin/windows/contrib/1.7
—————

————————————————————

—————

————————————————————


تعداد صفحات : 71 | فرمت فایل : WORD

بلافاصله بعد از پرداخت لینک دانلود فعال می شود