مفاهیم آمار و تخمین های بیزینی
مقدمه
قبل از دو دهه اخیر پیش بینی های اقتصادی بوسیله مدلهای ساختاری انجام می گرفت که اکثراً منتج شده از نظریات کنیز بودند از آنجائیکه در آن دوره این مدلها نتوانستند حوادث مهم اقتصادی را پیش بینی نمائید بنابراین روش برداری های خود رگرسیونی توسعه پیدا کردند از جمله انتقاداتی که به این روش وارد می شود اینست که این روش به تخمین بیش از حد مبتلا می باشد برای رفع این مشکل یک مدل بیزینی توسط لیترمن و همکارانش توسعه پیدا کرد که در آن اعتقادات پیشین در مورد متغیرها همراه با داده ها ترکیب و یک چارچوب بیزینی را برای پیش بینی کنندگان فراهم می آورد از آنجاییکه این روش از اطلاعات قبلی در مورد متغیرها استفاده می کند این امر به ساختن پیش بینی های بیشتر اقتصادی و کمتر هنری کمک می کند در این فصل ابتدا مفاهیم آمار و تخمین های بیزینی بیان می شود سپس روش VAR و کاربردهای آن تشریح می گردد و در قسمت پایانی به تشریح روش BVAR می پردازیم.
ارتباط بین علوم اقتصاد و آمار:
با تمرکز به مسئله کمیابی در علم اقتصاد، این علم به میزان زیادی به مسئله تصمیم گیری مربوط می باشد. همچنانکه می دانیم سوخت ماشین تصمیم اطلاعات می باشد بنابراین روشهایی برای فراهم آوردن اطلاعات آماری و ارتباط آن با علم اقتصاد که منجر به تصمیم گیری بهینه می شود توسعه پیدا کرده اند که در چارچوب دو روش نظریه کلاسیک نمونه گیری و روش بیزینی در علم آمار مورد مطالعه قرار می گیرند. در ذیل به شرح مختصری از این روشها پرداخته می شود.
روش کلاسیک نمونه گیری:
استنتاج آماری با استفاده از روش کلاسیک با استفاده از ویژگیهای زیر مشخص می شود.
الف- تخمین ها و روشهای آزمون بر حسب ویژگیهای موجود در نمونه آماری ارزیابی می شوند.
ب- احتمال یک حادثه برحسب حد فراوانی نسبی آن حادثه تعریف می شود.
پ- هیچ شرطی برای ورد مشاهدات غیر نمونه ای (nonsample) و اطلاعات زیان (loss information) وجود ندارد.
هنگامی که تخمین پارامترها با استفاده از روش کلاسیک انجام می شود یک تخمین زننده بدون تورش با مینیمم واریانس مطلوب محقق می باشد زیرا بطور متوسط این تخمین زننده ها به پارامترهای حقیقی (نسبت به تخمین زننده های بدون تورش دیگر) نزدیکتر هستند. در این روش تخمین فاصله ای و آزمون فرضیه بر حسب ویژگیهای بزرگ نمونه ای، نمونه های مورد مطالعه ارائه می شود همچنین در روش کلاسیک از آنجایکه پارامترها در نمونه های تکراری ثابت فرض می شوند، توزیع احتمال برای پارامترها تعیین نمی شود.
روش بیزین:
در چارچوب بیزینی احتمال بر حسب یک درجه از اعتقادات تعریف می شود (هر چند که ویژگیهای تخمین زننده ها و آزمونهایی که بر روی نمونه آماری انجام می گیرید نیز مورد مطالعه قرار می گیرید اما پایه اصلی برای استنتاج و انتخاب تخمین زننده ها نمی باشند) در این روش احتمال یک حادثه بر حسب اعتقادات شخص در مورد اینکه این حادثه تا چه اندازه محتمل است که ظاهر شود انجام می گیرید این اعتقادات ممکن است به اطلاعات کمی و یا کیفی وابسته باشند اما لزوماً به فراوانی نسبی حادثه در یک نمونه بزرگ از آزمایش های فرضی آتی1 وابسته نمی باشد بنابراین در آمار بنزینی احتمال یک مفهوم ذهنی (Subjective) و اشخاص مختلف ممکن است احتمال متفاوتی از یک حادثه را ارائه دهند همچنین ویژگی اصلی در تحلیل های بیزینی اینست که عدم اطمینان درباره مقدار یک پارامتر ناشناخته برحسب توزیع احتمال بیان می شود. در این روش پارامترها بصورت متغیرهای تصادفی مورد مطالعه قرار می گیرند و بدین صورت که نتایج متفاوت از یک آزمایش مصداق های2 متفاوتی از یک پارامتر بیان می کند، مورد ملاحظه قرار نمی گیرند. بنابراین توزیع احتمال ذهنی بر روی یک پارامتر برحسب آگاهی شخصی، درباره آن پارامتر می باشد این آگاهی ممکن است قبل از مشاهده اطلاعات موجود در نمونه وجود داشته باشد که تابع توزیع این آگاهی شخصی، توزیع پیشین3 نام دارد همچنین تابع توزیعی که از ترکیب تابع توزیع پیشین و اطلاعات نمونه حاصل می شود تابع توزیع پسین4 نام دارد. یک نکته مهم در اینجا اینست که توزیع پسین حاصله می تواند به عنوان یک توزیع پیشین مورد استفاده قرار گیرد زمانی که با اطلاعات نمونه ای دیگر در آینده مواجهه می شویم. روشی که توزیع پیشین را با اطلاعات نمونه برای تشکیل توزیع پسین، ترکیب می کند قضیه بیز نام دارد.
طریقه بدست آوردن تابع توزیع پسین:
اگر P(B/A) عبارتست از احتمال وقوع حادثه B به شرط معلوم بودن حادثه A باشد. آنگاه می توان احتمال وقوع حوادث را بصورت زیر بیان کرد:
از رابطه فوق نتیجه می شود که:
که عبارت فوق به عنوان قضیه بیز شناخته می شود.
حال برای نشان دادن توابع توزیع پیشین و پسین فرض می کنیم که تابع چگالی احتمال پیوسته باشد اگر برداری از پارامترها و y برداری از مشاهدات موجود در نمونه برای تابع چگالی پیوسته باشد در این صورت تابع بطور جبری همانند تابع درستنمایی برای می باشد که همه اطلاعات نمونه ای در مورد را شامل می شود. در چارچوب بیزینی از آنجایکه توزیع احتمال ذهنی برای وجود دارد ] برداری تصادفی می باشد[. بنابراین بصورت تابع توزیع شرطی y به شرط مورد ملاحظه قرار می گیرید حال طبق رابطه (1-5) می توانیم بنویسیم:
که به h تابع چگالی پیوسته برای و y ، g به تابع چگالی برای و f به تابع چگالی برای y دلالت می کند حال اگر عبارت فوق را بازنویسی کنیم داریم:
که این عبارت همان قضیه بیز می باشد که در این عبارت بیانگر تابع چگالی پسین برای و بیانگر تابع چگالی پیشین برای (اطلاعات غیر نمونه ای در مورد ) می باشد. از آنجائیکه داده های نمونه ای بصورت ثابت و معلوم در اختیار هستند در نتیجه f(y) ثابت می باشد بنابراین برای بدست آوردن اگر داده های نمونه ای y ثابت باشند می توانیم تابع را بصورت تابع در ستنمایی نشان دهیم بنابراین قضیه بیز بصورت زیر بیان می شود.
5
که رابطه را بصورت زیر نیز می توانیم بیان کنیم
(اطلاعات پیشین) × (اطلاعات درستنمایی) اطلاعات پسین
رابطه (5-5) نشان می دهد که چگونه اطلاعات پیشین در مورد (که برحسب تابع چگالی پیشین بیان می شود) بوسیله اطلاعات نمونه ای (که بر حسب تابع در ستنمایی بیان می شود) اصلاح می شود تا اطلاعات پسین در مورد (که بر حسب تابع چگالی پسین بیان می شود) بدست آید. نمودار (1-5) فرآیند بدست آمدن توزیع پسین را نشان می دهد.
تخمین نقطه ای
سوالی که در این قسمت با آن مواجهه می شویم اینست که چگونه یک تخمین نقطه ای برای انتخاب کنیم بطوریکه زیانهای ناشی از تخمین بیش از حد6 و یا کمتر از مقدار واقعی7 مینیمم گردد.
هنگامی که تخمین نقطه ای بیزینی را انجام می دهیم تخمین های متعددی بر اساس چگالی احتمال پسین حاصل می گردد. بنابراین باید مناسبترین تخمین برای انتخاب شود که که این انتخاب بر اساس تابعی انجام می شود که تابع زیان8 نام دارد اگر مقدار واقعی پارامتر و مقادیر تخمین آن باشد تابع زیان صورت بیان می شود. نکته ای که باید به آن توجه کنیم اینست که با افزایش خطای تخمین، زیان نیز افزایش پیدا می کند بنابراین انتظار براینست که یک تابع افزایش از باشد همچنین تابع زیان ناشی از تخمین بیش از حد ممکن است متفاوت از تابع زیان ناشی از تخمین کمتر از مقدار واقعی باشد که در این حالت گفته می شود تابع زیان نامتقارن 9 است. بسته به نوع توزیع چگالی احتمال پسین تابع زیان می تواند بصورت متفاوتی انتخاب گردد. اما آنچه که بطور کلی اهمیت دارد، توجه به برخی از معیارهای گرایش به مرکز در توزیع پسین مانند میانه، میانگین و مد می باشد زیرا که اگر توزیع پسین غیر قرینه باشد این معیارهای تمایل به مرکز با هم متفاوت خواهند بود و مسئله انتخاب در بین آنها وجود خواهد داشت. در قسمت بعد چند نمونه از توابع زیان معرفی می شود. فرآیند رسیدن به بهینه بطور خلاصه در شکل (2-5) بیان شده است.
تابع زیان درجه دوم (quadratic loss function):
برای بدست آوردن تخمین نقطه ای، تابع زیان درجه دوم بصورت زیر بیان می شود.
که c یک ثابت می باشد این تابع یک تابع متقارن می باشد زیرا زیانهای ناشی از تخمین بیش از حد همانند زیانهای ناشی از تخمین کمتر از مقدار واقعی می باشد همچنین این تابع از درجه دو می باشد زیرا زیان، تابعی درجه دو از خطای تخمین می باشد همچنانکه می دانیم ناشناخته است. برای غلبه بر این مشکل میانگین وزنی تمام زیانهای مرتبط با همه مقادیری که در بر می گیرد را پیدا می کنیم و ی که میانگین زیانها را مینیمم کند انتخاب می شود، تابع وزنی که انتخاب می شود همان تابع توزیع پسین است (شکل تابع زیان و انتخاب متناظر با تابع زیان بهینه در شکل (3-5) نشان داده شده است). اگر یک تخمین نقطه ای از باشد، در صورتی زیان برابر صفر می باشد که باشد در غیر اینصورت با افزایش ، L نیز افزایش می یابد برای بدست آوردن میانگین زیان از تابع زیر استفاده می شود.
تابع زیان خطای مطلق (Absolote Error Loss Function)
در این حالت بصورت زیر تصریح می گردد
زمانیکه تابع زیان بصورت قدر مطلق خطا در نظر گرفته می شود میزان زیان انتظاری زمانی حداقل می گردد که برابر با میانه توزیع باشد.10
تخمین بیزین ضرایب رگرسیون خطی:
از آنجاییکه بدست آوردن تخمین ضرایب در رگرسیونهای دو متغیره و مرکب بیزینی، مستلزم اثباتهای طولانی می باشد بنابراین در این قسمت تخمین ضرایب بدون ارائه روش اثبات بیان می گردد.
تخمین بیزین ضرایب رگرسیون دو متغیره
معادله زیر را در نظر می گیریم
با فرض اینکه فروض کلاسیک در مورد معادله (9ـ5) صادق باشد (می توان فرض کرد که Xi تصادفی باشد اما در این صورت باید مستقل از Ui توزیع شده باشد و تابع چگالی احتمال آن پارامترهای را شامل نشود). اگر از معادله (9ـ5) امید ریاضی بگیریم، میانگین شرطی بصورت زیر حاصل می شود.
حال با فرض اینکه n مشاهده داریم، می خواهیم احتمال نمونه مشاهده شده را بصورت تابعی از مقادیر و بدست آوریم در نتیجه داریم:
از آنجائیکه ها مشاهده شده و معلوم هستند بنابراین عبارت بالا را به تابع درستنمایی تغییر می دهیم11
حال اگر که این تابع درستنمایی را درتابع توزیع پیشین ضرب کنیم تابع توزیع پسین بدست می آید اما بسته به اینکه توزیع پیشین چگونه در نظر گرفته شود، توزیع حاصل پسین زیر بصورت متفاوتی حاصل می شود.
تخمین بنزین در رگرسیون مرکب12:
در این قسمت توزیع پیشین اطلاعاتی 13 (informative) در دو حالت مورد بررسی قرار می گیرد همچنین فرض می شود که توزیع پیشین دارای شکل مشابهی با توزیع چگالی درستنمایی باشد. که این نوع توزیع پیشین را توزیع پیشین همانند (Conjugate) می نامند لحاظ این توزیع باعث می شود که محاسبات مربوط به انتگرال گیری جهت حصول توزیع های حاشیه ای ساده تر گردد.
توزیع پیشین اطلاعاتی برای ضرایب و عدم لحاظ آن برای :
با فرض اینکه توزیع پیشین بصورت نرمال k متغیره با میانگین و ماتریس واریانس ـ کواریانس توسط محقق در نظر گرفته شده باشد همچنین واریانس معادله رگرسیونی معلوم باشد پسین حاصله برای میانگین و واریانس بصورت زیر بیان می شود.
(13ـ5)
(14ـ5)
که در معادلات فوق به ترتیب تخمین زن روش کلاسیک، مقدار پیشین ضرایب (میانگین پیشین توزیع)، ماتریس واریانس پیشین می باشد. ملاحظه می شود که تخمین زن بنزین در (13ـ5) متوسط وزنی تخمین زن OLS و مقدار پیشین آن می باشد و F نیز به عنوان وزن واریانسهای پیشین و تابع چگالی درستنمایی می باشد.
توزیع پیشن اطلاعاتی برای ضرایب و :
در این حالت با این فرض که مشخص نمی باشد توزیع پسین حاصله برای میانگین و واریانس بصورت زیر بیان می شود
که در معادله فوق m درجه آزادی بصورت m=n-k+d می باشد که n تعداد مشاهدات، k تعداد پارامترهای مدل و d درجه آزادی است که بصورت پیشین توسط محقق تعیین می شود همچنین تخمین می باشد. در واقع d نیز پارامتر پیشین برای بوده که توسط محقق تعیین می شود براساس دو معادله فوق مشاهده می شود که هرچه تعداد نمونه افزایش یابد واریانس ضرایب کوچکتر و عکس آن بزرگتر می شود لذا وزن بیشتری را به b یعنی تخمین زن روش کلاسیک می دهد بنابراین با افزایش تعداد نمونه، نتایج به نظریه کلاسیک نزدیک می شود.
سرچشمه مدل سازی VAR:
قبل از دو دهه اخیر اقتصاد سنجی سنتی به منظور تخمین و تصریح ارتباط بین متغیرهای کلان اقتصادی از مدل های معادلات همزمان در مقیاس بزرگ استفاده می کرد از این سیستم برای پیش بینی ، تحلیل سیاستی و آزمون تئوریهای اقتصادی رقیب استفاده می شد.
فعالیت های تحقیقاتی انجام گرفته توسط کمیسیون کولیز (Cowles Commissions)در ایالات متحده امریکا در دوره (1970ـ1945) براساس استفاده از این مدلها در مقیاس بزرگ بود. این مدلها براساس شرایط تئوریکی منتج شده از نظریات کینز تصریح می شد. در اواخر دهه 1970 میلادی این شیوه مدل سازی به چند دلیل مورد حملات متعدد قرار گرفت:
نخست نوسانات زیاد در این سالها و بی ثباتی مرتبط با حوادث بی سابقه همچون، از هم پاشیدگی نظام برتون ودز و شوکهای نفتی منجر به شکست وسیع پیش بینی با استفاده از این مدلهای اقتصاد کلان شد ثانیاً اقتصاددانان اعتبار تئوری های کینزی را زیر سوال بردند و از مدل های که در آن انتظارات عقلایی عاملان را مدنظر قرار می داد دفاع کردند و بیان نمودند که این مدل ها ارتباط بین متغیرهای کلان اقتصادی را بطور صحیح تر نمایش می دهد. ثالثاً متدلوژی مدلهای اقتصاد کلان در مقیاس بزرگ شدیداً بوسیله کریستوفر سیمز14 (1982ـ1980) مورد انتقاد واقع شد او دو ضعف متدلوژیکی این مدلها را بیان کرد.
الف ـ تصریح سیستم معادلات همزمان براساس جمعی سازی مدلهای جزءای15 بود بدون آنکه این مدلها ارتباط متقابل میان متغیرهای حذف شده را مدنظر قرار دهند16.
ب ـ ساختار پویای این مدلها، اغلب به منظور فراهم آوردن قیدهای لازم برای رسیدن به شناسایی و یا شناسایی بیش از حد فرم ساختاری تصریح شده است.
با توجه به این انتقادها، سیمز از مدلهایی استفاده کرد که تصریح آن براساس ویژگی های آماری داده های تحت مطالعه بنا شده بود در حقیقت سیمز تصریح بردارهای خود رگرسیونی را پیشنهاد کرد یعنی مدلهای چند گانه ای که هر سری تحت مطالعه بروی تعداد معینی از وقفه های همه سریها بطور پیوسته رگرس می شود. از آنجائیکه استفاده از این مدل ها موفقیت گسترده ای را به همراه داشت و محققان ثابت کردند که این روش دارای ابزارهای آماری قابل انعطاف و مفید می باشد بنابراین در بسیاری از زمینه های تحقیقاتی بجای استفاده از سیستم معادلات همزمان این مدلها مورد استفاده قرار گرفتند.
فرآیند خود رگرسیون برداری (تعریف، تصریح، تخمین)
یک فرآیند خود رگرسیون برداری از درجه P [VAR(P)] برای یک سیستم شامل M متغیر بصورت زیر تعریف می شود.
که در این سیستم شامل M معادله، V=(v1…..vm)' یک بردار M بعدی و
ماتریس ضرایب همان ویژگی های استوکاستیکی موجود در خطاهای فرم حل شده در سیستم معادلات همزمان را دارا می باشد. حال اگر m این معادله موجود در سیستم (با فرض T مشاهده) را انتخاب کنیم داریم:
که بردار ضرایب m امین معادله سیستم می باشد از آنجائیکه هر M معادله موجود در سیستم همین رگرسیون ماتریس x را دارند بنابراین M معادله موجود در سیستم را بصورت زیر می توانیم بنویسیم17:
از آنجائیکه در چنین سیستم های، تخمین های GLS با LS یکسان می باشند بنابراین هر معادله موجود در سیستم را بوسیله روش LS بطور مجزا می توانیم تخمین بزنیم بنابراین بدون از دست دادن کارایی تخمینی هر معادله بصورت زیر تخمین زده می شود.
و برای کل سیستم بطور فشرده داریم:
همچنین در مدل فوق یک تقریب از ماتریس کواریانس بصورت زیر مشخص می شود
انتخاب درجه VAR:
برای انتخاب وقفه های بهینه در مدل های VAR معیارهایی طراحی شده اند که می توان به آزمون نسبت لاکیلهود (LR) معیار شوارتز (SC) و اکا یک (AIc) اشاره کرد.
آزمون نسبت لاکیلهود بصورت زیر بیان می شود:
برای استفاده از این آزمون ابتدا یک مدل VAR نامقید (با بیشترین وقفه ممکن) تخمین زده می شود آنگاه ماتریس کواریانس باقیمانده ها حساب می شود ()، سپس طول وقفه را کاهش داده و ماتریس کواریانس مدل مقید برآورد می شود این آماره دارای توزیع با درجه آزادی برابر با تعداد قیدهای تحمیل شده به سیستم می باشد (به عنوان مثال اگر 3 وقفه کاهش یابد آنگاه n23 که n تعداد معادلات سیستم می باشد، درجه آزادی این توزیع می باشد). در مدل فوق فرضیه صفر بصورت زیر بیان می شود.
طول وقفه برابر سیستم مقید استH0=
اگر مقدار آماره فوق کمتر از جدول در سطح معناداری مشخص باشد نمی توان فرضیه صفر را رد کرد لازم به ذکر است که در معادله فوق T تعداد مشاهدات، C تعداد پارامترها در سیستم نامقید (اگر تعداد پارامترها در معادلات سیستم یکسان نباشد معادله ای که بیشترین پارامتر را داراست در نظر گرفته می شود)
همچنین معیار (AIC) و (SC) بصورت زیر تعریف می شوند
n=1,…P
که M تعداد متغیرها در سیستم و T حجم نمونه و تخمین ماتریس کواریانس باقیمانده ها است که از مدل VAR(n) بدست می آید در معادلات بالا درجه P جایی بهینه است که معیار (SB) و (ATC) مینیمم شوند
موارد استفاده مدلهای VAR:
پیش بینی:
اگر فرآیند تولید مجموعه ای از متغیرها از نوع فرآیند بردار تصادفی شناخته شده باشد در این شرایط پیش بینی بهینه عبارتست امید شرطی همه اطلاعات داده شده تا دوره ای که پیش بینی برای آن انجام می گیرید بهینه در این جا به این معنی می باشد که میانگین مربعات خطای پیش بینی (Forcast mean square error) هر متغیر مینیمم گردد بنابراین برای یک مدل VAR(p) می توان نوشت
که برای معادله فوق داریم: و
از ماتریس میانگین مجذور خطا (MSE) اغلب به عنوان سنجه ای از عدم اطمینان پیش بینی استفاده می شود (Forcast uncerteinty) که ماتریس (MSE) برای پیش بینی مرحله n ام بصورت زیر نشان داده می شود.
از آنجائیکه پیش بینی yT(h) بدون تورش است یعنی E[yT+h-yT(h)]=0 . ماتریس کواریانس خطای پیش بینی است که برای یک سیستم VAR(P) بصورت زیر بیان می شود
علیت گرنجر
فرض کنید برای تحلیل یک بردار () سری زمانی پایای yt ، آن را به دو بردار کوچکتر (sub-vector)، y1t و y2t افراز کنیم که ابعاد آنها () و () باشد بطوریکه n1+n2=n ، در اینصورت می توانیم عبارت زیر را تعریف کنیم.
که It شامل مجموعه اطلاعات گذشته و حال مقادیر برادر yt و شامل مجموعه اطلاعات گذشته و حال بردار می باشد. در این حالت مفهوم علیت گرنجر را بدین صورت می توانیم بیان کنیم که بردار علیت – گرنجر بردار اگر که تابع چگالی پیش بینی بردار y2t بصورت زیر بیان شود.
که عبارت فوق بدین معنی می باشد که مقادیر گذشته و حال بردار y1 نمی تواند در پیش بینی مقادیر آتی y2 موثر باشد.
حساب شوکها و تجزیه واریانس خطای پیش بینی:
استفاده دیگر از مدلهای VAR که بوسیله سیمز (1981ـ1980) و دیگران عمومیت یافته است گاهی اوقات حساب شوکها نامیده می شود این واژه به واکنش سیستم به شوک در یکی از متغیرها اشاره می کند بجای شوک در متغیرها گاهی اوقات یک شوک انحراف معیار موردنظر ملاحظه قرار می گیرید. اگر یک مدل VAR(p) را بصورت یک فرایند میانگین متحرک نمایش دهیم داریم:
که در معادله فوق kj امین عنصر Mi واکنش k امین متغیر به یک شوک واحد تجربه شده بوسیله متغیر j را در i دوره پیش نمایش می دهد (مشروط براینکه این اثر بوسیله دیگر شوکها به سیستم سرایت پیدا نمی کند). مشکلی که در مدل فوق وجود دارد اینست که ها همبسته هستند بنابراین این امر واکنش واقعی سیستم را مبهم می سازد برای رفع این مشکل حساب شوکها اغلب بوسیله یک VAR تغییر شکل یافته انجام می پذیرد که فرایند نوفه سفید، ماتریس کواریانس قطری دارد بطوریکه هیچ ارتباط آنی میان اجزاء وجود ندارد. از آنجائیکه ماتریس کواریانس از یک مدل VAR(p) معین مثبت است یک ماتریس غیر منفرد مانند P وجود دارد بطوری که باشد حال اگر معادله را بدین صورت بازنویسی کنیم داریم
که و می باشد و بردار wtویژگی های مناسب، یعنی اینکه اجزای آن ناهمبسته و دارای واریانس واحد هستند را دارا می باشد.
همیچنین ماتریس واکنش سیستم yt واکنش سیستم yt به شوکهای واحد wmt را نشان می دهد. مشکلی که در این حالت وجود دارد اینست که ماتریس p یکتا نمی باشد (nonuiqueness) در نتیجه نیز یکتا نمی باشد به عبارت دیگر p های زیادی وجود دارند که می کند اگر اطلاعات اولیه ای وجود داشته باشد که یکی از P ها را ترجیح دهد مشکل شکل فوق رفع می شود.
نمایش مدل VAR(P) بصورت (29ـ5)، امکان دیگری برای تفسیر متغیرهای وجود در سیستم را پیشنهاد می کند اگر ماتریس کواریانس خطای پیش بینی (MSE) از یک پیش بینی K مرحله ای را بصورت زیر بنویسیم داریم.
که m امین عنصر قطری فقط مجموع مربعات عناصر در m امین ردیف است همچنین مجموع m امین عنصر قطری رابطه (33ـ5)، MSE یا واریانس خطای پیش بینی، h مرحله پیش بینی متغیر ym می باشد توزیع شوکها در j امین متغیر به این MES بصورت زیر نشان داده می شود
که امین عنصر می باشد این تجربه واریانس خطای پیش بینی در داخل اجزاء بوسیله شوکهایی که به صورت انفرادی متغیرها را تحت تاثیر قرار می داد، بدست می آید.
محدودیتهای مدل UVAR:
از جمله محدودیت های که در مدل UVAR وجود دارد می توان به موارد زیر اشاره کرد.
الف ـ سازنده یک مدل ممکن است که اعتقاد داشته باشد که بعضی از ضرایب متغیرهای موجود در مدل دارای علامت خاصی باشند، اما در مدلهای UVAR ضرایب نهایی که از تخمین بدست می آید بدون توجه به اعمال این محدودیت و اعتقاد پیشین تخمین زده می شود.
ب ـ از آنجائیکه متغیرهای موجود در مدل UVAR زیاد می باشد پیش بینی و ارتباط متقابل بین متغیرها یکی از مشکلات جدی مدل های UVAR می باشد. زیرا داده های درست که محققان در اختیار دارند کم می باشد
پ ـ روشهای آماری که برای تخمین ضرایب بکار می رود (مثلاً روش OLS) بهتر ین تشریح را از داده های موجود بدست می آورد در حالی که داده های که برای ارتباط بین متغیرها بکار می روند بوسیله اثرات تصادفی متعدد پیچیده می شوند.
ت ـ از آنجائیکه مقادیر جاری و گذشته هر متغیر در هر معادله ظاهر می شود تعداد ضرایب تخمینی، در مقایسه با تعداد مشاهدات بسیار زیاد می باشد بنابراین ضرایب به برازش بیش از حد (over fiting) دوچار می باشند و این برازش بیش از حد ارتباط ضرایب موجود در مدل را گمراه می کند.
از مدل های ساختاری تا مدلهای BVAR:
در مدلهای ساختاری اقتصاد سنجی که بطور وسیع پیش بینی های اقتصادی را انجام می دهند مشکل برازش بیش از حد بوسیله وارد کردن متغیرهایی در معادله که تئوری اقتصادی پیشنهاد می کند و بیشترین ارتباط را با متغیر وابسته دارد انجام می پذیرد بنابراین تئوری اقتصادی منبع اصلی اعتقادات پیشین در مدلهای ساختاری می باشد و این اعتقادات پیشین این مشکل را بوسیله خارج کردن تعداد زیادی از متغیرهای موجود در معادلات انجام می دهند باید توجه شود که خارج شدن متغیرها از معادلات با اطمینان بیان می کند که این ضرایب صفر هستند بنابراین چنین قیودی اطلاعات مفید موجود در داده های تاریخی (historical data) را نادیده می گیرید.
این امر باعث شد که عده ای از اقتصاد دانان به قیدهای مذکور شک کنند و بیان کردند که این قیدها در پیش بینی همانند حصار عمل می کند بنابراین روش بردارهای خود رگرسیون بیزینی را گسترش دادند که دارای انعطاف بیشتر و بطور صحیح تر اعتقادات پیشین آماری را نشان می دهد در ابتدا به نظر می رسد که مدلهای BVAR با مدلها UVAR هیچ تفاوتی نداشته باشد (مقادیر جاری و با وقفه همه متغیرها در هر دو مدل وجود دارد)، اما به دلیل استفاده زیاد از اعتقادات پیشین برای کاهش تخمین بیش از حد به مدلهای ساختاری شبیه می باشد هرچند که منابع اعتقادات پیشین و راههای که از این اعتقادات پیشین استفاده می شود در مدل هایBVAR نسبت به مدلهای ساختاری متفاوت هستند در روش BVAR محققان از اعتقادات پیشین آماری ودانش اقتصادی برای حدس زدن (guess) مقادیری از ضرایب که منجر به بهترین پیش بینی می شود استفاده می کنند بنابراین در روش BVAR نظریه آماری و مشاهدات منبع اصلی اعتقادات پیشین است در حالی که در مدل های ساختاری نظریه اقتصادی منبع اصلی اعتقادات پیشین است.
در مدل های BVAR تخمین بش از حد بوسیله انتخاب تعداد زیادی ضریب، اما تعدیل تاثیر داده ها بروی آنها انجام می شود بنابراین مادامیکه مدل سازان اعتماد کافی به حدس هایی که درباره ضرایب بیان می کنند داشته باشند، این امر باعث می شود که الگویهای تصادفی که ممکن است در داده ها تولید شود، برازش بیش از حد و یا حذف کامل یک متغیر اصلاح شود مزیت این روش نسبت به روشهای دیگر اینست که در امر تولید داده ها با اعتقادات پیشین (برای پیش بینی ) عینی تر18 و تجدیدشدنی تر19 می باشد که این امر بوسیله چند محقق تایید شده است. از آنجایکه این روش بوسیله اقتصادانانی انجام گرفته در دانشگاه مینه سوتا و فدرال رزروبانک مناپولیس فعالیت می کردند، این روش به سیستم اعتقاد پیشین مینه سوتا معروف شده است.
طریقه اعمال اطلاعات پیشین مینه سوتا
اولین مرحله در استفاده از مدلهای اعتقاد پیشین مینه سوتا محدود کردن مجموعه مدلهای ممکن بوسیله انتخاب متغیرها و ارتباط آنها بوسیله سیستم معادلات خطی می باشد بطور معمول انتخاب متغیرها تا اندازه ای بوسیله مدلساز انجام می گیرد همچنین بوسیله دلایل اقتصادی و تجربه های عملی متغیرهای دیگری که می توانند به این امر کمک کنند انتخاب می شوند بعد از انتخاب متغیرها، اعتقادات پیشین بوسیله تعیین احتمالاتی در مورد مجموعه متغیرهای موجود در مدل که منجر به بهترین پیش بینی می شود انجام می گیرد در این روش بهترین حدس از ضرایب تقریباً برابر با فرضیه گام تصادفی با رانش20 می باشد این فرضیه بروی مشاهدات آماری که اغلب منبع عمده مشکلات مدلساز می باشد مورد استقاده قرار می گیرد زیرا رفتار بسیاری از متغیرهای اقتصادی چنان به نظر می رسد که غیرقابل پیش بینی اند برای یک چنین متغیرهای بهترین پیش بینی آنست که مقدار آتی متغیر برابر مقدار جاری آن باشد مقادیر پیشین ضرایب مدل VAR که همان میانگین های توزیع پیشین ضرایب می باشند برای اولین وقفه خودی (First own lag) برابر یک و برای بقیه ضرایب صفر در نظر گرفته می شود (در هر معادله اولین وقفه از متغیر وابسته برابر یک و بقیه وقفه ها صفر در نظر گرفته می شود) از آنجائیکه این اقدام یک روش بیزینی است بنابراین روش پیشین مینه سوتا نمی تواند اطمینان کامل به بهترین حدس (guess) منتج شده از فرضیه گام تصادفی داشته باشد بنابراین مدلساز باید یک اندازه کمی از اعتماد را برای بهترین حدس ارائه دهد بنابراین در این روش از چیزی استفاده می شود که آمار دانان آن را واریانس پیشین ضریب 21 می نامند برای تعیین این واریانس پیشین ضریب که در واقع میزان کشیدگی توزیع ضرایب می باشد از این ایده استفاده می شود که وقفه های طولانی تر، اطلاعات کمتری را برای توضیح متغیر وابسته ارائه می دهند لذا هر چه طول وقفه طولانی تر می شود مقدار واریانس کوچکتر شده و محقق با قطعیت و احتمال بالاتری ضریب صفر بودن متغیر را می پذیرد شکل (الف 4ـ5) و (ب 4ـ5) توزیع پیشین ضرایب وقفه های خودی و وقفه های متقاطع را نشان می دهد همانطور که ملاحظه می شود هرچه که وقفه ها طولانی تر می شود (چه برای وقفه های خودی و متقاطع) کشیدگی توزیع حول میانگین بیشتر می شود و مدلساز با احتمال بالاتری میانگین صفر را می پذیرد همچنین دیده می شود که وقفه های ابتدایی متغیرهای متقاطع دارای میانگین صفر بوده اما توزیع در حول میانگین بسیار پخ می باشد این بدان معنی است که محقق میانگین صفر را پذیرفته اما احتمال کمتری را برای این مقدار در نظر می گیرد و در واقع به داده ها اجازه می دهد که با توجه به تخمین درستنمایی و واریانس مربوطه مقدار آن تعیین گردد همچنین به واریانس پیشین های متقابل یک وزن داده می شود که عامل واریانس (own-versus-cross) نام دارد در واقع این فاکتور مقیاس باعث می شود که واریانس پیشین متقاطع بطور یکتا در مقابل واریانس پیشین خودی قابل مقایسه باشد به عبارت دیگر این فاکتور تفاوت های مربوط به واحدهای شمارش را لحاظ کرده و باعث می شود تا اطلاعات پیشین بدون توجه به واحد اندازه گیری متغیر تعیین گردد از آنجائیکه توزیع ضرایب بصورت نرمال در نظر گرفته می شوند همبستگی بین ضرایب (کواریانس ضرایب) صفر در نظر گرفته می شود.
بیان اطلاعات پیشین مینه سوتا بصورت جبری:
اگر () و () به ترتیب میانگین و انحراف معیار توزیع پیشین باشند که iوjوk به ترتیب نمایانگر شماره معادله، شماره متغیر حاضر در معادله نمونه VAR و شماره طول وقفه باشند در این صورت داریم.
و
اگر
وو
اگر
و
اگر
و
اگر
در معادلات فوق OT، W,d بعنوان پارامترهای اصلی 22 شناخته می شوند که OT 23 بیانگر کشیدگی کلی توزیع می باشد (انحراف معیار اولین وقفه خودی می باشد) و d کاهش دهنده واریانس ها برحسب طول وقفه 24 می باشد که هرچه بزرگتر باشد.
توزیع کشیده تر می شود که بدین معنا است که مقدار میانگین پیشین با قطعیت بیشتری مورد پذیرش قرار می گیرد، در واقع این عامل باعث می شود که واریانس ها بطور یکنواخت، زمانی که طول وقفه افزایش می یابد، کاهش یابند همچنین w عبارت است از کشیدگی سنی توزیع 25 می باشد این ضریب می تواند بین کشیدگی های توزیع برای متغیر خودی و متقاطع تفاوت قائل شود با کاهش دادن مقدار w، اثرهای متقابل بین متغیرهای متقاطع با متغیر وابسته کاهش می یابد در ضمن فاکتور مقیاس26 می باشد که انحراف معیار باقیمانده ها از یک مدل خود رگرسیونی تک متغیره نامقید برای متغیر i می باشد (تعداد وقفه ها در این معادله معمولاً برابر تعداد وقفه های مدل BVAR در نظر گرفته می شود در روش مینه سوتا مقادیر OT و d به ترتیب برابر 1/0 و 1 در نظر گرفته می شود همچنین مقادیر w بر ای متغیرهای خودی برابر یک و برای کلیه وقفه های دیگر 5/0 در نظر گرفته می شود چون نحوه تعیین مقادیر پیشین برای تمام معادلات VAR یکسان می باشد و w بصورت قریبه برای متغیرهای متقاطع 5/0 در نظر گرفته می شود این شیوه را اطلاعات پیشین قرینه مینه سوتا می نامند در مقاله ای که بوسیله سیمز، لیترمن و دوان 27 (1984) ارائه گردیده است مقادیر wij برای وقفه های متقاطع بصورت متفاوت تعیین گردیده که این روش را روش عمومی یا غیر قرینه اطلاعات پیشین مینه سوتاه می نامند.
(37ـ5)
اگر
(روش عمومی)
اگر
(38ـ5)
اگر
(روش قرینه)
اگر
حال اگر این اطلاعات پیشین و مقادیر حاصل از تابع درستنمایی براساس قضیه بیز ترکیب شوند تخمین های بیزی بدست می آیند علاوه بر تخمین های بیزینی که در قسمت (4ـ5) بیان گردید یک روش دیگر برای محاسبه تخمین های بیزینی روش قیود تصادفی تایل ـ گلدبرگر می باشد که بصورت زیر بیان می شود.
که r و R بیانگر میانگین پیشین و واریانس پیشین ضرایب همچنین و به ترتیب انحراف معیار رگرسیونی و انحراف معیار پیشین ضرایب (متغر j در معادله i در وقفهk) می باشد با توجه به معادلات بالا تخمین زننده ها بصورت زیر بیان می شوند.
که در معادله (40ـ5) واریانس معادله بوده و بصورت زیر تعریف می شود
که در معادله (41ـ5) تخمین OLS از ، (n-k) درجه آزادی، n تعداد مشاهدات و k پارامترهای تخمین زده شده در معادله می باشد.
1 – future hypothetical experiments
2 – realizations
3 – prior distribution
4 – posterior distribution
5 – به معنای متناسب می باشد.
6 – overestimation
7 – underestiamation
8 – loss function
9 – asymmetric
10 – بیانی ساده از توابع زیان همراه با مثال در کتاب زیر وجود دارد
آمار مقدماتی- (ج، دوم) – نوشته تامس اچ. ووناکات، رانلدجی. ووناکات- ترجمه محمدعلی مشکانی. مرکز نشر دانشگاهی، تهران
11 – از آنجائیکه یک مقدار ثابت می باشد بنابراین نمی تواند بر شکل توزیع اثر بگذارد بنابراین دو معادله (11ـ5) و (12ـ5) با همدیگر متناسب (proportional) می باشند.
12 – مطالب این قسمت برگرفته از منبع زیر می باشد.
محمد مزرعتی (1378)ـ پیش بینی و تحلیل سیاسی از تقاضای حامل های انرژی در ایران (مدل های BVAR,VAR و پیشنهاد مدل SBVAR)، دانشکده اقتصاد (دانشگاه تهران)، پایان نامه دکترا
13 – توزیع پیشین می تواند بصورت اطلاعاتی و یا جاهل (Ignorance) در نظر گرفته شود پیشن اطلاعاتی بدین معنی است که شکل توزیع پیشین و نیز مشخصه های توزیع (میانگین و واریانس) دقیقاً توسط محقق مشخص شده است اما در توزیع پیشین جاهل، محقق با در نظر گرفتن یک توزیع بسیار پخ (Flat) نظر دقیق و مطمئنی برای مقدار میانگین توزیع ارائه نمی دهد چنانچه توزیع پیشین بصورت جاهل باشد آنگاه تخمینی بنزین همان تخمین روش کلاسیک است ولی تفسیر آن متفاوت می باشد.
14 – C.A.Sims
15 – aggregation of pratial equilibrium models
16 – در قسمت های بعد در مورد حذف کامل یک متغیر توسط مدلهای ساختاری بحث می شود.
17 – در معادلات فوق * بیانگر ضرب کرونکر می باشد.
18 – More objective
19 ـ لیترمن (1980)، کنل و رتنر (1983) ، دوان ، لیترمن و سیمز (1984)
20 – rondom walk hypothesis with drift
21 – Pror variance cofficient
22 – Hyper Parameters
23 – overal Tightness
24 – day Decay
25 – Relative Tightness
26 – Scaling Factor
27 – forcasting and conditional projection using Realistic prior distribution Tomas Doan, Robert litterman and c.s.sims, econometric Reviews, (1984), vol.3, no.1,pp.1-100
————————————————————
—————
————————————————————
37