بسم الله الرحمن الرحیم
نام درس :روشهای ارزشیابی آموزشی
رشته:علوم تربیتی
تعداد واحد :2 واحد (تخصصی)
نام منبع:روشهای ارزشیابی آموزشی
مولف:دکتر علی رضا کیامنش
انتشارات: دانشگاه پیام نور
تهیه کننده:محمد هاشم رضایی-عضو هیات علمی دانشگاه پیام نور
هدفهای درس
هدف نهایی درس:دانشجویان رشته علوم تربیتی با مطالعه این درس روشهای مختلف ارزشیابی آموزشی و چگونگی کاربرد آنها را یاد می گیرند.
هدفهای کلی درس
دانشجویان رشته علوم تربیتی پس از مطالعه مطالب این درس
با روند تکوینی ارزشیابی آموزشی آشنا می شوند.
الگوهای مختلف ارزشیابی را مورد بررسی قرار می دهند.
رابطه ارزشیابی را مورد بررسی قرار می دهند
رابطه ارزشیابی و هدفهای آموزشی را درک می کنند
آزمونهای هنجاری و ملاکی را مقایسه می کنند
6. چگونگی اندازه گیری عملکردهای عاطفی را می آموزند
7. با طرحهای مختلف ارزشیابی آشنا می شوند
8. پگونگی نمونه گیری در ارزشیابی را می آموزند
9. با روش تهیه گزارش یافته های ارزشیابی آشنا می شوند
10. به کاربرد اصول و مفاهیم آموخته در این درس علاقه مند می شوند
فصل اول
دور نمای ارزشیابی آموزشی
هدفهای کلی
دانشجویان پس از مطالعه مطالب این فصل :
سیر تحول ارزشیابی آموزشی را در میابند.
مفاهیم و دیدگاه های مختلف درباره ارزشیابی را می آموزند
مفهوم ارزشیابی را با مفاهیم اندازه گیری ،ارزیابی،پاسخ گویی و پژوهش مورد مقایسه قرار می دهند.
تاریخچه ارزشیابی
با توجه به منابع موجود مقامات چینی قریب 4000 سال پیش برای انتخاب پرسنل اداری خود از امتحان استفاده می کردند .مدارک زیادی وجود دارد که در ایران باستان،یونان و روم نیز از امتحان استفاده می شده است.
تاریخچه ارزشیابی در ایران
بر پایه منابع تاریخی در زمان شاپور،پادشاه ساسانی،در جندی شاپور برای دانشجویان پزشکی مجالس امتحان و آزمایش برگزار می شد و به شرکت کنندگان در امتحان به شرط موفقیت اجازه نامه پزشکی داده می شد.
در قرن هفتم هجری چون تعداد داوطلبان ورود به مدرسه مستنصریه بغداد از ظرفیت مدرسه بیشتر بوده هنگام ورود به مدرسه امتحان می گرفتند و از میان آنان تعداد لازم را انتخاب می کردند.
در مدارس دوره قاجار امتحان و آموزش هر دو جنبه فردی داشتند و در بیشتر موارد امتحان،شفاهی و در حضور شاگردان دیگر صورت می گرفت.امتحان کتبی فقط در موارد ضروری نظیر املا و خط به عمل می آمد.به جای آئین نامه امتحانات برای هر شاگرد یک آئین خاص در پایان یک کتاب یا یک درس به اجرا در می آمد.
بیشتر فعالیتهایی که در آغاز قرن بیستم به آنها عنوان ارزشیابی آموزشی داده شده با آزمون کردن دانش آموزان در مدارس ارتباط پیدا می کند.در اوایل قرن بیستم آزمونهای استاندارد شده رواج پیدا کرد و تقریبا ً همزمان با آزمونهای استاندارد شده ،جنبش اعتبار گذاری بر موسسات و برنامه های آموزشی در آمریکا آغاز گردید.از آن زمان به بعد از فرایند اعتبار گذاری به عنوان یکی از روشهای اصلی در ارزشیابی موسسات آموزشی استفاده شده است.
رالف تایلر در فاصله سالهای 1930 تا 1945 ضمن فعالیت های خویش به این نتیجه رسید که یک برنامه آموزشی باید حول هدفهای آموزشی مشخص سازمان تدوین یابد .قضاوت در مورد موفقیت یا عدم موفقیت برنامه باید با توجه به میزان موفقیت فراگیران در رسیدن به هدفهای تعیین شده برای برنامه انجام پذیرد.
رالف تایلر را باید بنیان گذار ارزشیابی آموزشی دانست .وی برای اولین بار یک تعریف مشخص و روشن برای ارزشیابی آموزشی ارائه نمود.همچنانکه گفته شد تایلر ارزشیابی را ”عمل مقایسه هدفها و عملکردهای برنامه می داند.“ تفاوت عمده روش تایلر با سایر روشها در این است که وی به بیان واضح و روشن هدفهای آموزشی برنامه قبل از اجرای عمل ارزشیابی توجه می کند و معتقد است که عامل ارزشیابی باید به برنامه ریزان آموزشی کمک کند تا بتوانند رفتارهای مورد نظر را که انتظار می رود در اثر
اجرای برنامه آموزشی در رفتار فراگیران شرکت کننده در برنامه بوجود آید مشخص سازند.
استافل بیم به منظور غلبه بر ضعفهای روش تایلر ضرورت تدوین یک مفهوم بهتر و جامعتر را برای ارزشیابی مطرح نمود.اواخر دهه 1960 میلادی تا اوایل دهه 1970 میلادی را می توان دوره بحث و مجادله در زمینه درک و پذیرش ارزشیابی آزمون دانست.در نیمه دوم دهه 1970 ارزشیابی آموزشی به عنوان یک حوزه تخصصی جدید و مستقل مورد قبول واقع گردید.
تعاریف ارزشیابی
فرهنگ روانشناسی آرتور ربر ارزشیابی را در معنی عام”تعیین ارزش و یا اهمیت یک چیز می داند“ و به صورت خاص تر ارزشیابی را ” تعیین میزان موفقیت یک برنامه ،یک درس،یک سری آزمایش ، یک دارو و … در رسیدن به هدفهای اولیه آنها می داند“.فرهنگ وبستر ارزشیابی را قضاوت یا تعیین ارزش یا کیفیت کردن تعریف می کند.
در فرهنگهای فارسی دهخدا و دکتر معین واژه های ارزشیابی و ارزشیاب یا عامل ارزشیابی به کار برده نشده است.ولی واژه های ارزیابی و ارزیاب تعریف شده اند.در فرهنگ دهخدا ارزیابی ، ”عمل یافتن ارزش هر چیز ،تقویم” و ارزیاب ،”کسی که ارزش هر چیزی را معین می کند،مقوم”تعریف شده است.در فرهنگ معین ارزیابی،”عمل یافتن ارزش و بهای هرچیز ،سنجش و بررسی حدود هرچیز وبرآورد کردن ارزش آن” و ارزیاب “ارزیابنده ،کسی که ارزش هر چیزی را معین می کند،مقوم،کارشناس
و سر رشته دار تعیین ارزش و بها تعریف شده است.
اولین تعریف رسمی از ارزشیابی به نام رالف تایلر ثبت شده است.وی ارزشیابی را وسیله ای جهت تعیین میزان موفقیت برنامه در رسیدن به هدفهای آموزشی مطلوب مورد نظر می داند.در این تعریف هدفهای آموزشی به تغییرات مطلوبی اشاره می کنند که انتظار می رود در اثر اجرای برنامه آموزشی در رفتار فراگیران حاصل آیند.
پاپهام معتقد است که ارزشیابی یعنی تعیین ارزش کردن .”ارزشیابی آموزشی نظامدار در بر گیرنده سنجش رسمی ارزش پدیده های آموزشی است .”
کرانباخ به نقل از کتاب ارزشیابی آموزشی ارزشیابی را جمع آوری و استفاده از اطلاعات جهت تصمیم گیری در مورد یک برنامه آموزشی می داند.به عقیده کرانباخ تعیین موفقیت یا عدم موفقیت برنامه های آموزشی فقط از طریق جمع آوری اطلاعات در موقعیت های واقعی یاددهی –یادگیری امکان پذیر می باشد.و هرگونه تصمیم گیری در مورد برنامه آموزشی باید بر اساس اطلاعات جمع آوری شده صورت گیرد.
استفال بیم و شینک فیلد در کتاب ارزشیابی نظام دار یک تعریف جامع برای ارزشیابی ارائه کرده اند.”ارزشیابی عبارت است از فرایند تعیین کردن،بدست آوردن،و فراهم ساختن اطلاعات توصیفی و قضاوتی در مورد ارزش و مطلوبیت هدفها ، طرحها،اجرا و نتایج به منظور هدایت تصمیم گیری ،خدمت به نیازهای پاسخ گویی و درک بیشتر از پدیده های مورد بررسی
با توجه به تعریف ارائه شده ،جنبه کلیدی یک برنامه آموزشی که باید مورد سنجش قرار گیرند و نوع ارزشیابی لازم برای هریک از این جنبه ها عبارتند از :تعیین هدفهای برنامه توسط ارزشیابی زمینه تهیه طرح مناسب برای رسیدن به هدفها توسط ارزشیابی درون داد؛اجرای طرح تهیه شده توسط ارزشیابی فراگرد ؛و بررسی محصول یا بازده برنامه توسط ارزشیابی بازده.
معیارهای اساسی برای هر یک از چهار نوع ارزشیابی مطرح شده عبارتند از :ارزش و مطلوبیت.در این تعریف برای ارزشیابی سه هدف تعیین گردیده است:هدایت تصمیم گیری ؛فراهم کردن اطلاعات برای پاسخ گویی و درک بیشتر از پدیده های مورد بررسی.همچنین برای ارزشیابی دو نقش در نظر گرفته شده:نقش تصمیم گیری یا تکوینی و نقش پاسخگویی یا تراکمی.
بیبای ارزشیابی را چنین قضاوت می کند:”جمع آوری و تفسیر نظامدار شواهدی که در نهایت به قضاوت ارزشی با چشمداشت به اقدامی معین بیانجامد.”
در تعریف بیبای چهار عنصر کلیدی وجود دارد.شناخت این عناصر می تواند به درک مفهوم ارزشیابی از نظر بیبای کمک کند.
استفاده از واژه نظام دار به این معنی است که اطلاعات مورد نیاز برای عمل ارزشیابی ،با استفاده از شیوه های مختلف جمع آوری اطلاعات ،به صورت منظم و هدفدار کسب می گردند.
منظور از واژه تفسیر شواهد در تعریف بیبای این است که جمع آوری اطلاات به خودی خود نمی تواند کار موثر و مفیدی باشد .این اطلاعات باید با دقت و احتیاط کامل توسط ارزشیاب یا افراد ذیصلاح دیگر مورد تفسیر قرار گیرند.
واژه قضاوت ارزشی سومین عنصر کلیدی تعریف بیبای است.
چهارمین عنصر کلیدی در تعریف بیبای”چشمداشت به اقدامی معین “بیانگر این مسئله است که ارزشیابی تصمیم مدار است،و مطالعات ارزشیابی با این قصد که نتایج آنها به انجام عملی در مورد برنامه آموزشی یا موضوع ارزشیابی شده منجر خواهد شد، انجام می پذیرند.دامنه عمل حاصل از نتایج ارزشیابی می تواند یک طیف گسترده را در بر گیرد.
تفاوت ارزشیابی با چند مفهوم دیگر
برای ارزشیابی تعاریف مختلفی وجود دارد که در شرایط فعلی نمی توان از میان آنها یکی را به عنوان جامعترین تعریف انتخاب نمود.با توجه به این مسئله برای شناخت بیشتر مفهوم ارزشیابی ،به چند مفهوم که با مفهوم ارزشیابی نزدیک بوده ،و گاه مترادف و هم معنی به آن نیز به کار برده می شوند،اشاره کرده و تفاوتهای هریک از آنها با مفهوم ارزشیابی بیان می گردد.
1- ارزشیابی و اندازه گیری
اندازه گیری مانند ارزشیابی یک فرایند نظامدار است که با استفاده از قواعدی ،که صحت آنها را می توان مورد آزمایش قرار داد ،به مقادیر مختلفی از یک صفت که در یک فرد یا شیئی وجود دارد عدد اختصاص داده می شود.بدین ترتیب از طریق انجام اندازه گیری مقدار موجود از یک صفت در فرد یا شیئی مشخص شده و با کمیت عددی نشان داده می شود. عمل اندازه گیری امکان توصیف عینی تر از پدیده مورد اندازه گیری و همچنین امکان مقایسه را فراهم می سازد.
فرایند اندازه گیری اساسا ً غیر ارزشی بوده و به مقادیر بدست آمده از طریق عمل اندازه گیری هیچگونه ارزشی تعلق نمی گیرد . صفات اندازه گیری شده فقط به صورت کمی توصیف می شوند.و در مورد آنها قضاوت و داوری صورت نمی گیرد. در حالی که صفات مطالعه شده در ارزش یابی هم مورد علاقه هستند و هم با ارزش .این صفات به صورت کیفی توصیف می شوند و در مورد آنها قضاوت ارزشی می شود .با وجود این اندازه گیری پایه و مقدمه ارزشیابی است.
ارزشیابی و اندازه گیری دو هدف مختلف را دنبال می کنند . هدف از اندازه گیری در آموزش و پرورش مقایسه فراگیران در ویژگیهای مورد نظر است.
2- ارزشیابی و پژوهش
پژوهش فعالیتی است هدفدار ،منظم و طرح ریزی شده برای پیدا کردن پاسخ سوالات مطرح شده از طریق مقایسه تعریف پژوهش با تعاریف مختلف ارائه شده برای ارزشیابی می توان به تفاوتهای این دو پی برد.
تفاوتهای عمده ارزشیابی و پژوهش
نیروی به حرکت در آورنده پژوهشگر برای انجام فعالیت پژوهشی،کنجکاوی و کسب آگاهی است.هدف وی کشف رابطه های علت و معلولی بین پدیده ها و رسیدن به یک حقیقت علمی است.پژوهشگر –حد اقل در کوتاه مدت-به اهمیت و کاربرد دانش بوجود آمده کمتر توجه می کند.
مجری ارزشیابی نیز به شیوه ای نظامدار در تلاش جمع آوری اطلاعات و کسب دانش تازه است.نیازها و هدفها محرک وی در انجام فعالیت ارزشیابی بشمار می آیند.هدف مجری ارزشیابی بیشتر آن است که از دانش کسب شده در تصمیم گیری استفاده کند و عملی انجام دهد.
پژوهشگر از دانش کسب شده برای نتیجه گیری استفاده می کند ،به همین دلیل پژوهش را نتیجه مدار گویند.در حالی که مجری ارزشیابی از دانش کسب شده برای تصمیم گیری استفاده می کند،به همین دلیل ارزشیابی را تصمیم مدار گویند.
کار پژوهشگر با شناخت ،درک پدیده ها و پاسخ به سوال یا سوالهای مطرح شده پایان می پذیرد.وی درباره یافته های پژوهش داوری نمی کند ولی مجری ارزشیابی از شناخت ،درک پدیده ها و یا پاسخهای بدست آمده برای بهبود و اصلاح پدیده ارزشیابی شده استفاده می کند،و به وضوح در مورد ارزش برنامه آموزشی یا موضوع ارزشیابی شده قضاوت می کند.
پژوهشگر به تولید دانشی علاقه دارد که که تا حد ممکن تعمیم پذیر باشد.به همین دلیل وی مطالعه پژوهشی خود را به صورتی طرح ریزی می کند که از یک طرف بتواند یافته های حاصل از پژوهش را ،با اطمینان هرچه بیشتر،به کار بندی آموزشی نسبت دهد.
مجری ارزشیابی به تولید دانشی علاقه دارد که به یک تصمیم یا تصمیم های خاص منجر گردد.مجری ارزشیابی به تعمیم یافته ها فکر نمی کند.اصولا ً دانشی که از طریق ارزشیابی کسب می گرددفاقد کلیت لازم برای تعمیم می باشد.مجری ارزشیابی به دانشی می اندیشد که به کمک آن موضوع بررسی شده را بشناسد و در مورد آن تصمیم گیری کند.
در پژوهش فرض یا فرضیه های مطرح شده آزمون می شوند. در حالی که در ارزشیابی میزان موفقیت در رسیدن به هدفها مورد سنجش قرار می گیرد.به عبارت دیگر یافته های ارزشیابی با هدفها و یا معیارهای از قبل مشخص شده سنجیده می شود.
پژوهشگر در انتخاب موضوع مورد پژوهش و مدت زمان اجرای پژوهش تقریبا ً آزادی عمل دارد .وی موضوعی را انتخاب می کند که بنحوی در حوزه علاقه و تخصص او قرار داشته باشد.همچنین با توجه به شرایط با میل خود طول مدت اجرای پروژه پژوهشی راتعیین می کند.
از مجری ارزشیابی معمولا ً خواسته می شود تا یک پروژه یا فعالیت آموزشی خاصی را ارزشیابی کند.در نتیجه وی از طرف سفارش دهندگان عمل ارزشیابی تحت فشار قرار می گیرد تا فعالیت ارزشیابی را در یک فاصله زمانی معین به اتمام رساند.
3- ارزشیابی و پاسخ گویی
هرکس که فعالیتی انجام می دهد باید شواهدی را نشان دهد که مشخص سازد آن فعالیت را در چه حد و با چه کیفیتی انجام داده است.
عمل پاسخگویی در بخش صنعت ،یعنی تضمین کالا و تعویض در صورت ضرورت باعث گردیده که تلاش برای تولید کیفی،کارآیی و دوام بیشتر محصول افزایش یابد.به همین ترتیب در آموزش و پرورش نیز خیلی طبیعی به نظر می رسد اگر اولیا انتظار داشته باشند که مدرسه در برابر پیشرفت فرزندان آنها پاسخگو باشند.
برای پاسخ گویی باید فعالیتهای انجام شده مورد ارزشیابی قرار گیرند.یافته های حاصل از ارزشیابی یعنی عملکرد ها یا آنچه که انجام گرفته ،در اختیار کسانی قرار می گیرد که برنامه مطالعه شده را مورد سوال قرار داده اند.در واقع ارزشیابی وسیله پاسخگویی است.
در حالی که اکثر برنامه های پاسخگویی در آموزش و پرورش به ارزشیابی نیاز دارند ،تمام فعالیتهای ارزشیابی به خاطر پاسخگویی به اجرا در نمی آیند.در نتیجه اگرچه ارزشیابی پاسخگویی نیست و فعالیت هر ارزشیابی ضرورتا ً به منظور پاسخگویی اجرا نمی شود،ولی هر فعالیت پاسخگویی به انجام ارزشیابی نیاز دارد.
4- ارزشیابی و ارزیابی
ارزیابی معلم از عملکرد فراگیران تا حد زیادی مشابه ارزشیابی مجری ارزشیابی از برنامه آموزشی است.معلم به عنوان عامل ارزیابی در مورد عملکرد فراگیر قضاوت می کند، تصمیم می گیرد و در صورت ضرورت با توجه به شرایط و امکانات،راههای خاصی را برای کمک به فراگیر انتخاب و به اجرا در می آورد.بدین ترتیب معلم،مجری ارزیابی،فراگیر و عملکرد وی موضوع ارزیابی است.
در ارزشیابی نیز اگرچه قابلیتهای فراگیران مورد اندازه گیری قرار می گیرد ولی هدف ارزشیابی ،قضاوت در مورد ارزش برنامه و موثر بودن برنامه برای یک سری خاص از فراگیران شرکت کننده در برنامه است.تعیین قابلیت فرد فرد فراگیران در حوزه توجه مجری ارزشیابی قرار نمی گیرد. ارزشیابی بر خلاف ارزیابی ،در بیشتر موارد یک فعالیت بیرونی است که نباید با عمل ارزیابی معلم از فراگیران اشتباه گرفته شود و یا جایگزین آن گردد.
در منابع فارسی ،واژه ارزیابی مترادف با واژه ارزشیابی بکار رفته است .در منابع انگلیسی ،واژه ارزیابی مترادف با اندازه گیری و ارزشیابی و گاه نیز به عنوان یک مفهوم کاملا ً مستقل و متفاوت با دو واژه دیگر به کار رفته است.در این کتاب واژه ارزیابی به معنی ارزیابی عملکرد فراگیران و واژه ارزشیابی به منظور ارزشیابی برنامه،دوره،درس،و یا موسسه به کار گرفته می شود.
فصل دوم
الگوهای ارزشیابی
هدفهای کلی
دانش جویان پس از مطالعه مطالب این فصل :
به علل بهره گیری از الگوهای متفاوت ارزشیابی پی می برند.
الگوهای مختلف ارزشیابی را مورد تحلیل و مقایسه قرار می دهند.
به بهره گیری از الگوهای ارزشیابی،متناسب با شرایط و موقعیتهای مختلف علاقه مند می شوند.
الگوهای ارزشیابی
برای انجام عمل ارزشیابی ،چندین الگو ارائه شده است .قبل از بحث در مورد الگوهای ارزشیابی،به برخی از تفاوتهای موجود بین این الگوها اشاره می شود.
تفاوتهای موجود بین الگوها
تفاوت در هدفی اصلی ارزشیابی
تفاوت در زمینه های تجربی و آموزشی صاحب نظران
ماهیت موضوع درسی یا مطلبی که مرکز توجه تلاشهای ارزشیابی است
تاکید بر بخش خاصی از فرایند ارزشیابی
الگوهای ارزشیابی
برای انجام عمل ارزشیابی تقریبا ً 28 الگوی مختلف ارائه شده است.این الگوها را می توان به صورتهای مختلف دسته بندی کرد.این الگوها را در سه دسته تقسیم بندی نموده از هر یک الگویی به عنوان نمونه معرفی می کنیم:
الگوهای تحقق یافتن هدف
الگوهای قضاوتی
قضاوت بر اساس ملاکهای درونی
قضاوت بر اساس ملاکهای بیرونی
3. الگوهای تسهیل در تصمیم گیری
الگوهای تحقق یافتن هدف
رالف تایلر هنگام کار در زمینه ارزشیابی برنامه معروف به هشت سال مطالعه در دانشگاه اوهایو،تغییرات اساسی در ارزشیابی آموزشی به وجود آورد.تایلر ضمن فعالیتهای خود در این پروژه ،متقاعد گردید که یک برنامه آموزشی ،باید حول هدفهای آموزشی مشخص سازمان و تدوین یابد.
تایلر بر دامنه وسیعی از فعالیتهای آموزشی نظیر برنامه درسی و امکانات آموزشی تاکید نمود.وی همچنین بر ضرورت تهیه ،تدوین،طبقه بندی و توصیف هدفها با واژه های رفتاری در آغاز مطالعه ارزشیابی تاکید نمود.بدین ترتیب وی ارزشیابی را به یک فرایند تعیین میزان انطباق هدفها و عملکردها تبدیل نمود.تایلر نتیجه گرفت که تصمیم گیری در مورد یک برنامه باید الزاما ً بر اساس میزان انطباق هدفهای برنامه و بازده های واقعی آن انجام پذیرد.
تایلر برای انجام فرایند واقعی ارزشیابی 8 مرحله منطقی ارائه کرده است.این مراحل به نقل از کتاب استافل بیم و شینک فیلد عبارتند از:
تهیه و تدوین مقاصد یا هدفهای برنامه
طبقه بندی هدفهای برنامه
بیان هدفها به صورت رفتاری
تدوین شرایط و موقعیتهایی که بتوان دستیابی به هدفها را در آن نشان داد
5. بیان هدفهای برنامه ارزشیابی به پرسنل ذیربط در موقعیتهای انتخاب شده برای ارزشیابی
6. انتخاب یا تدوین تکنیکهای مناسب اندازه گیری
7. جمع آوری داده های مربوط به عملکرد
8. مقایسه داده ها با هدفهای رفتاری
امتیازات روش تایلر
تایلر علاوه بر بیان هدفهای برنامه و تعیین معیارهای لازم برای قضاوت و تصمیم گیری ،برای جمع آوری اطلاعات مورد نیاز از روشهای مختلف نیز بهره می گرفت.وی ضمن استفاده از آزمونهای نوشتاری ،روشهای دیگر نظیر مشاهده رفتار فراگیران ،مصاحبه با آنان و ارزیابی تکالیف و تمرینهای فراگیران را نیز مورد استفاده قرار می داد.
تایلر ارزشیابی را یک فرایند اصلاح کننده می دانست و معتقد بود که فعالیت ارزشیابی باید برای تدوین یا تعریف مجدد هدفهای آموزشی ،اطلاعات مفید و دقیقی فراهم آورد.
مورد استفاده از روش تایلر
تایلر در آغاز ارزشیابی هدف –مدار را روشی مناسب جهت استفاده معلمان و برنامه ریزان می دانست ولی از سال 1960 به بعد ،عاملان ارزشیابی را نیز به فهرست استفاده کنندگان از روش خود افزوده است.شیوه تایلر علاوه بر اصلاح برنامه و طبقه بندی هدفها ،در موقعیت های مختلف کلاس نیز می تواند مورد استفاده قرار گیرد.این امر بیشتر به دقت معلم در استفاده مثبت از این روش بستگی دارد .از شیوه تایلر می توان برای هدایت یادگیری دانش آموزان نیز استفاده کرد.
بسط روش تایلر
روش تایلر به صورتهای مستقیم و غیرمستقیم در کار صاحب نظران دیگر موثر بوده است.مثلا ً پرووس الگوی ارزشیابی اختلاف را ارائه کرده است ،که بر جستجو برای پیدا کردن تفاوت بین هدفهای یک برنامه و پیشرفت واقعی دانش آموزان در رسیدن به هدفها تاکید می کند.همچنین در الگوی ارزشیابی ”هزینه-سود “که توسط لوین مورد بحث قرار گرفته است. عامل ارزشیابی تلاش می کند که رابطه بین هزینه های یک برنامه و میزان دسترسی به هدفها را در آن برنامه مشخص سازد.
الگوهای قضاوتی
در این الگوها قضاوت عامل ارزشیابی نقش عمده و اصلی در امر ارزشیابی ایفا می کند.این الگوها را می توان به دو دسته تقسیم کرد:
الگوهای قضاوت بر اساس ملاکهای درونی
الگوهای قضاوت بر اساس ملاکهای بیرونی
تفاوت ملاکهای درونی و بیرونی
ملاکهای درونی به ذات برنامه توجه دارند و معیار بکار گرفته شده اغلب معیار فراگرد است.برای ارزشیابی فعالیتهای آموزشی این ملاکها عبارتند از :فضای آموزشی،امکانات آموزشی،تراکم دانش آموزان در کلاس،نسبت معلم به شاگرد ،تجهیزات آموزشی،کتابخانه،کادر آموزشی مدرسه با توجه به سابقه خدمت،مدرک تحصیلی،رشته تحصیلی ،فعالیتهای علمی و پژوهشی آنها و…
ملاک بیرونی به اثرات برنامه توجه دارند و معیار بکار گرفته شده اغلب بازده یا برون داد است.ملاکهای بیرونی یک برنامه آموزشی عبارتند از :اثرات برنامه،رفتار فراگیران،موثر بودن اثرات برنامه،نگرشها و آرزوهای دانش آموزان حاصل از تجارب آموزشی.
الگوهای قضاوت براساس ملاکهای درونی
یکی از متداولترین الگوها مبتنی بر ملاکهای درونی ،الگوی اعتبار بخشی است.در این الگو ،از طرف موسسه یا سازمان های ارزشیابی ،با فاصله های زمانی از موسسه ،دانشکده،یا مدرسه مورد ارزشیابی بازدید به عمل می آید،و موسسه با توجه به معیارهای کمی از قبل تعیین شده و با توجه به آنچه که در حال حاضر وجود دارد مورد قضاوت و ارزشیابی قرار می گیرد.این روش،یک مطالعه همه جانبه است که تمام ابعاد یک موسسه آموزشی را در بر می گیرد.
با وجود این الگوی اعتبار بخشی به دو دلیل کمتر مورد توجه و قبول متخصصان تعلیم و تربیت واقع می گردد:
این الگو فقط به ملاکهای درونی توجه دارد و اثرات برنامه را مورد توجه قرار نمی دهد.
شواهد عینی و تجربی برای اثبات وجود رابطه مثبت بین عوامل درونی برنامه و عوامل بیرونی آن وجود ندارد
الگوی قضاوت بر اساس ملاکهای بیرونی
در این الگوها عامل ارزشیابی با توجه به ملاک های بیرونی –اثرات برنامه – موسسه،دوره،درس،یا برنامه آموزشی را مورد ارزشیابی و قضاوت قرار می دهد.از میان الگوهای مبتنی بر ملاکهای بیرونی دو الگو از همه معروفتر هستند : الگوی ارزشیابی استیک و الگوی ارزشیابی اسکریون
الگوی ارزشیابی مصرف کننده-مدار
اسکریون تعریف تایلر از ارزشیابی را به علت آنکه مطلوبیت هدفهای برنامه را مورد توجه قرار نمی دهد،محدود و گمراه کننده می داند .اسکریون و پیروان روش وی،نتایج برنامه را ارزشیابی می کنند،درمورد هدفهای برنامه قضاوت می کنند و در مورد مطلوبیت کلی برنامه ها نتیجه گیری می کنند.بدین ترتیب اسکریون مسولیت اصلی عامل ارزشیابی و هدف ارزشیابی را قضاوت کردن می داند.
اسکریون برای ارزشیابی دو نقش عمده در نظر می گیرد. نقش تکوینی و نقش تراکمی یا پایانی. منظور از تکوینی ،کمک در تدوین برنامه و منظور از تراکمی،تعیین شایستگی کلی برنامه است پس از آنکه به طور کامل به اجرا در می آید.
در نقش تکوینی ارزشیابی یک فعالیت درونی است که همزمان با تدوین و اجرای برنامه آموزشی با هدف بهبود و اصلاح برنامه به اجرا در می آید.
برای قضاوت در مورد یک برنامه در حال تکوین معمولا ً از سه نوع اطلاعات استفاده می شود.اطلاعات مبتنی بر قضاوت ، اطلاعات مبتنی بر مشاهده و اطلاعات مبتنی بر عملکرد فراگیران شرکت کننده در برنامه.
ارزشیابی پایانی یا تراکمی ،به منظور انجام یک سنجش جامع از کیفیت برنامه کاملا ً اجرا شده ،صورت می پذیرد.در نقش تراکمی ارزشیابی ممکن است مدیران را در تصمیم گیری نسبت به کل برنامه اجرا شده یاری دهد.
ارزشیابی هدف آزاد
اسکریون در بخشی از الگوی ارزشیابی مصرف کننده مدار خویش ارزشیابی هدف آزاد را در مقابل ارزشیابی هدف مدار تایلر مطرح کرده است.اسکریون معتقد است که یک برنامه آموزشی علاوه بر بازده های مورد انتظار و پیش بینی شده در برنامه،می تواند تاثیرات جانبی دیگری نیز به همراه داشته باشد،که وی آنها را بازده های پیش بینی نشده یا ناخواسته می نامد.
یکی از نتایج اصلی شیوه ارزشیابی هدف آزاد آن است که به عامل ارزشیابی وسعت دید بیشتری می دهد تا نتایج حاصل از اجرای یک برنامه –نتایج خواسته شده و ناخواسته-را مورد ارزشیابی قرار دهد و خود را آنچنان که در شیوه ارزشیابی هدف مدار رخ می دهد ،تنها به نتایج یا اثرات مورد انتظار برنامه محدود نسازد.
توجه به کیفیت هدف ها
اسکریون ارزشیابی را مترادف با تعیین میزان مطلوبیت هدفهای برنامه می داند و بر این نکته تاکید می کند که مطلوبیت هدفهای برنامه باید مشخص شوند.اگر هدفهای آموزشی مطلوب و با ارزش نباشند تعیین میزان موفقیت در رسیدن به آنها ،نمی تواند جالب و سودمند باشد.اسکریون به عاملان ارزشیابی پیشنهاد می کند که به ارزشیابی کیفیت هدفها و تعیین میزان موفقیت برنامه در کسب هدفهای تعیین شده ، با هم توجه کنند .
الگوهای تسهیل در تصمیم گیری
از میان الگوهای ارائه شده برای ارزشیابی سه الگو را می توان الگوی تسهیل در تصمیم گیری نامید.این الگوها عبارتند از : الگوی ارائه شده توسط استافل بیم و دیگران که به آن الگوی ارزشیابی سیپ گفته می شود.الگوی مرکز مطالعات ارزشیابی دانشگاه کالیفرنیا-لس آنجلس یا الگوی CSE و الگوی تفاوت یا اختلاف که توسط پروفسور پرووس ارائه شده است.
الگوی ارزشیابی سیپ
کاملترین تعریف که برای ارزشیابی در مدل سیپ ارائه شده است به شرح زیر است.
ارزشیابی عبارت است از فرایند تعیین کردن،بدست آوردن و فراهم ساختن اطلاعات توصیفی و قضاوتی در مورد ارزش و مطلوبیت هدفها ،طرح،اجرا و نتایج به منظور هدایت تصمیم گیری،خدمت به نیازهای پاسخگویی و درک بیشتر از پدیده های مورد بررسی.
در تعریف فوق برای ارزشیابی سه هدف تعیین گردیده است: هدایت تصمیم گیری،فراهم کردن اطلاعات برای پاسخگویی و درک بیشتر از پدیده های مورد بررسی.استفال بیم همانند اسکریون برای ارزشیابی دو نقش قائل است:نقش تصمیم گیری یا تکوینی و نقش پاسخگویی یا پایانی.
با توجه به تعریف ارائه شده جنبه های کلیدی برنامه که باید مورد سنجش قرار گیرند عبارتند از:تعیین هدفهای برنامه، تهیه طرح مناسب برای رسیدن به هدف،اجرای طرح تهیه شده و بررسی محصول یا بازده برنامه که به ترتیب توسط ارزشیابی زمینه،ارزشیابی درون داد،ارزشیابی فراگرد و ارزشیابی برون داد مورد ارزشیابی قرار می گیرند.
معیار اساسی برای هر چهار نوع ارزشیابی عبارتند از:ارزش و مطلوبیت.عامل ارزشیابی می تواند برای ارزشیابی یک برنامه ،با توجه به موفقیت از هر چهار نوع ارزشیابی بالا استفاده کند و یا آنکه فقط یک یا چند قسمت از برنامه را به صورت مستقل مورد ارزشیابی قرار دهد.
رابطه انواع ارزشیابی،نقش و مراحل در الگوی سیپ انواع ارزشیابی
الگوی سیپ تصمیم های آموزشی را به چهار گروه تقسیم می کند:
تصمیم های برنامه ریزی جهت تعیین اهداف برنامه
تصمیم های ساختی جهت طراحی شیوه های آموزش مناسب به منظور رسیدن به هدف
تصمیم های اجرایی جهت استفاده،هدایت و بهبود شیوه های آموزشی
تصمیم های دوباره سازی به منظور قضاوت و عکس العمل در مورد نتایج بدست آمده.
ارزشیابی زمینه
ارزشیابی زمینه با استفاده از روشهای توصیفی و مقایسه ای تلاش می کند که مسائل مشکلات آموزشی ،جنبه های مثبت و منفی برنامه ها ،نیازهای برآورده نشده و امکانات آموزشی به خدمت گرفته نشده را از طریق مصاحبه با افراد ذیصلاح و دست اندر کاران مسائل آموزشی ؛مشاهده مستقیم جریان آموزش؛اجرای آزمونهای تشخیصی جهت تعیین میزان عملکرد فراگیران و … مورد شناسایی قرار دهد.
ارزشیابی درون داد
هدف اصلی ارزشیابی درون داد کمک به تدوین برنامه ای است که برای ایجاد تغییرات آموزشی و حصول به هدفهای تعیین شده ،در مرحله ارزشیابی زمینه،طراحی شده است.
ارزشیابی فراگرد
نقش عامل ارزشیابی فراگرد آن است که چگونگی اجرای هر یک از بخش های برنامه را با آنچه که در برنامه پیش بینی شده مقایسه نموده و کمبود ها و نارساییهای احتمالی را مشخص می نماید.به طور کلی عامل ارزشیابی فراگرد تلاش می کند که برای این دو سوال عمده اطلاعات لازم را جمع آوری و فراهم سازد.
آیا بین زمان شروع و توالی قسمتهای مختلف برنامه در حال اجرا با آنچه که در طرح پیش بینی شده مطابقت وجود دارد؟
2. آیا قسمتهای مختلف برنامه به همان صورتی که در طرح پیش بینی شده به اجرا در می آیند؟
ارزیابی برون داد
هدف از ارزشیابی برون داد اندازه گیری تفسیر و قضاوت در مورد نتایج حاصل از برنامه است.سعی عامل ارزشیابی برون داد بر آن است که میزان موفقیت برنامه در بر آوردکردن نیاز گروههایی که برنامه جهت خدمت به آنان طراحی و به اجرا گذاشته شده است را مشخص سازد. ارزشیابی برون داد ارزش برنامه به اجرا گذاشته شده را مشخص کرده و اطلاعات لازم جهت تصمیم گیری در مورد ادامه، توقف،تبدیل و یا تکرار برنامه را فراهم می سازد.
تفاوتها و مشابهت های الگوهای ارزشیابی
علاوه بر تفاوتهای ذکر شده در زمینه استفاده از این الگوها نیز می توان به سه تفاوت عمده اشاره نمود.
الگوهای ارزشیابی از روشهای پژوهشی متفاوت استفاده می کنند.الگوهای تحقق یافتن هدف از روشهای کمی ، الگوهای قضاوتی اغلب از شیوه های بررسی در موقعیت طبیعی و الگوهای تسهیل در تصمیم گیری از هر دو روش کمی و کیفی بهره می گیرند.
الگوهای ارزشیابی از معیارهای متفاوت برای قضاوت
استفاده می کنند .الگوهای تحقق یافتن هدف از معیارهای بیرونی و از قبل تعیین شده و دو الگوی دیگر از معیارهای درونی استفاده می کنند.
3. الگوها از نظر نوع قضاوت با هم تفاوت داردند .الگوهای تحقق یافتن هدف کاملا ً عینی بوده و قضاوت آنها عینی است.الگوهای قضاوتی و تا حدی الگوهای تسهیل در تصمیم گیری بیشتر ذهنی هستند.
الگوهای ارائه شده برای انجام عمل ارزشیابی در دو ویژگی مهم مشترک هستند:
هدف اساسی تمام الگوها،فراهم ساختن اطلاعاتی است که به فرد در سنجش فعالیتهای برنامه کمک می کند.در تمام الگوها عامل ارزشیابی نقش فراهم کننده اطلاعات را ایفا می کند و ارزش عمل ارزشیابی تابع ارزش اطلاعات جمع آوری شده است.
تمام الگوها تلاش می کنند که اطلاعات دقیق و روا فراهم آورند.
فصل سوم
ارزشیابی و هدفهای آموزشی
هدفهای کلی
دانشجویان پس از مطالعه مطالب این فصل:
با هدفهای آموزشی و ویژگیهای آنها آشنا می شوند
نقش و اهمیت هدفهای آموزشی را درک می کنند
هدفهای کلی و رفتاری را می شناسند
به نقش و اهمیت هدفهای آموزشی در ارزش یابی پی می برند.
سطوح مختلف هدفها را در هر یک از حوزه های شناختی و عاطفی می آموزند
6. نسبت به تدوین اهداف آموزشی در وزه های مختلف اقدام می کنند.
7. در نوشتن اهداف آموزشی مهارت پیدا می کنند.
ارزشیابی و هدفهای آموزشی
هدف آموزشی عبارتی است که تغییر مورد انتظار در رفتار یادگیرنده پس از شرکت در یک برنامه آموزشی را بیان می کند.تعریف فوق با تعریف آموزش یعنی فعالیتی که هدف آن به وجود آوردن یادگیری یا تغییر در رفتار است هماهنگ می باشد.به همین دلیل بیشتر روانشناسان تربیتی معتقد اند که هدفهای آموزشی باید بر حسب بازده مورد انتظار از یادگیرنده بیان شوند.به عبارت دیگر هدف آموزشی باید عبارتی باشد در مورد رفتار یادگیرنده،نه عبارتی در مورد رفتار یا فعالیت معلم.
در تعریف ارائه شده برای هدف آموزشی واژه مورد انتظار بیانگر آن است که هر عمل یا رفتاری که یادگیرنده انجام می دهد هدف محسوب نمی شود،تنها رفتارهایی هدف محسوب می شوند که دارای ارزش هستند و به دلیل با ارزش بودن مطلوب و مورد انتظار نیز هستند.واژه تغییر بیانگر تغییراتی است که در اثر آموزش و شرکت در فعالیتهای آموزشی کسب می شود.
واژه رفتار در تعریف هدف آموزشی از اهمیت خاصی برخوردار است.این واژه ضمن اهمیت داشتن،مشکل آفرین نیز می باشد.زیرا هر کس واژه رفتار را به نحو خاصی تفسیر می کند.ولف ضمن اشاره به عناصر مهم یک هدف آموزشی ،رفتار را در یک مفهوم گسترده مورد استفاد قرار می دهد،وی هر آنچه را فرد می گوید یا انجام می دهد رفتار می نامد.
اهمیت هدفهای آموزشی
برای بیان هدفهای آموزشی به صورتی واضح و روشن چندین دلیل ارائه شده است از جمله این دلایل می توان به سه دلیل عمده که توسط میگر ارائه شده اشاره نمود .میگر معتقد است که:
بیان هدفها به صورت روشن و مشخص یک مبنای دقیق و قابل استفاده برای انتخاب یا طراحی مواد و وسایل آموزشی ،محتوی آموزش و روشهای آموزش فراهم می سازد
2. از طریق بیان دقیق هدفها می توان دریافت که هدفها تحقق یافته اند یا خیر
3. شاگردان از طریق آگاهی یافتن از هدفهای آموزشی می توانند کوششهای خود را در جهت دستیابی به هدفهای مورد نظر سامان دهند .
تدوین هدفهای آموزشی
تدوین هدفهای آموزشی،حاصل یک فرایند عمدی و نظام دار است که بر اساس تجارب قبلی دانش آموزان و با در نظر گرفتن منابع و اطلاعات گوناگون انجام می گیرد.با توجه به نظر تایلر ،هدفهای آموزشی با بررسی نیازهای یادگیرندگان، نیازهای جامعه و ماهیت موضوع درسی که باید آموخته شود شروع می گردد و قصد این سه منبع پاسخ گویی به این سوالات است که چه نیازهایی باید برآورده شود؟
بطور کلی یک هدف آموزشی باید آنقدر کلی باشد که جهت دهنده باشد و آنقدر جزئی باشد که به روشنی توسط رفتاری که یادگیرندگان هنگام رسیدن به هدف از خو نشان می هند قابل بیان باشد
ولف هدفهای آموزشی را در سه سطح تدوین می کند.در سطح اول مقاصد اصلی،جهت گیری ها و هدفهای کلی برنامه ،در یک متن انشایی یا تشریحی در یک یا چند صفحه مطرح می گردد. در این سطح تدوین کننده هدف آزاد است که قصد خود را به صورتی تشریحی بیان نماید.
در سطح دوم تغییرات اصلی و عمده ای که انتظار می رود در رفتار یادگیرندگان بوجود آید،در قالب عبارتهای کلی مطرح می گردد. این عبارتها باید به نحوی تدوین شوند که به فعالیتهای معلم و یادگیرندگان جهت بدهند.معمولا ً برای محتوای یک درس 6 تا 15 هدف کلی تدوین می شود.در سطح سوم هدف کلی به چند هدف جزئی تر و مشخص تر تقسیم می شود.هر هدف کلی را می توان بر حسب کلیت آن به 6 تا 12 هدف جزئی تقسیم نمود.
برای تدوین هدفهای کلی می توان از چند اصل به عنوان راهنما استفاده نمود:
هدف باید بر حسب آنچه که معلم قصد دارد انجام دهد و یا برحسب بازده هایی که انتظار دارد یادگیرندگان در پایان آموزش انجام دهند تدوین شود.
در بیان هدفها باید از واژه هایی استفاده کرد که مقاصد آموزشی را بدون ابهام به خواننده یا مخاطب منتقل سازد
هر هدف باید فقط به یک عمل یا رفتار اشاره کند
جامعیت هدف باید در سطحی باشد که بتوان آنرا با چند هدف ویژه توصیف نمود
5. هدفها باید با تجارب یادگیری فراهم شده در کلاس هماهنگ باشند
6. هدفها باید در بر گیرنده فعالیتهایی باشند که یادگیرندگان قبلا ً آنها را فرا نگرفته اند.
7. هدفها باید در محدوده زمان تعیین شده برای آموزش قابل حصول باشند.
هدفهای رفتاری
هدفهای کلی به علت مبهم و قابل تفسیر بودن باید به هدفهای روشنتر و مشخص تر تقسیم شوند.برای تقسیم یک هدف کلی به هدفهای کوچکتر می توان این سوال را مطرح نمود:
دانش آموز چه باید بیان کند یا انجام دهد تا معلم متقاعد گردد که وی به هدف مورد نظر رسیده است؟
یک هدف رفتاری اگر به صورت کامل تدوین شده باشد معمولا ً از سه جزء مشخص تشکیل می شود.
رفتار:مقصود از رفتار فعالیتی است که شاگرد باید پس از شرکت در فعالیتهای آموزشی انجام دهد
شرایط اجرای عمل:شرایط یا امکانات یا محدودیتهایی که یادگیرنده با توجه به آنها عمل مورد انتظار را از خود نشان می دهد
معیار یا ملاک:ملاک حد نسابی است که بر اساس آن رفتاری خاص ارزشیابی می شود.
نتیجه گیری از مباحث هدفهای آموزشی
عمل ارزشیابی از فعالیتهای آموزشی یک دانش آموز، یک کلاس ،یک دوره و یا یک برنامه بدون آشنایی دقیق با هدفهای آموزشی یا بازده های مورد انتظار نمی تواند انجام پذیرد.برای ارزشیابی صحیح و منطقی از فعالیتهای آموزشی ،عامل ارزشیابی باید فعالیتهای مربوط به عمل ارزشیابی را با توجه به هدفهای تدوین شده انجام دهد.
سنجش نیاز های آموزشی
به طور خلاصه فعالیتهای اساسی برای انجام نیاز سنجی آموزشی را می توان به شرح زیر بیان نمود:
فراهم آوردن یک لیست کامل از هدفهایی که باید در نیاز سنجی مورد استفاده قرار گیرد
تعیین اولویت نسبی هدفهای تهیه شده
تعیین وضعیت مطلوب و مورد انتظار و وضعیت موجود و مشخص کردن میزان تفاوت بین این دو وضعیت
4. تعیین هدفهایی که از اهمیت خاصی برخوردار بوده و مشکل آموزشی به شمار می آیند.
نتیجه گیری از مباحث نیاز سنجی آموزشی
از نیاز سنجی آموزشی علاوه بر تدوین هدفهای آموزشی ،دوره ها و برنامه های رسمی آموزش ،می توان در زمینه های دیگر نیز استفاده نمود.مثلا ً اگر برنامه های آموزش ضمن خدمت کارکنان اداری و آموزشی بر اساس نیاز های تخصصی و حرفه ای آنان تدوین گردد و محتوی ارائه شده در جهت بر طرف کردن نیاز های آنان سامان داده شود،کارآیی این برنامه ها و همچنین علاقه و تمایل افراد نسبت به شرکت در برنامه های آموزش ضمن خدمت احتمالا ً افزایش خواهد یافت
طبقه بندی هدفهای تربیتی
هدفهای تربیتی را در سه حوزه یا حیطه شناختی ،عاطفی و روانی-حرکتی طبقه بندی می نمایند.
حوزه شناختی هدفهایی را شامل می شود که با یادآوری،بازشناسی،دانش و رشد تواناییها و مهارتهای ذهنی سرو کار دارد .این حوزه مهمترین زمینه کار برنامه ریزان درسی و مجریان ارزشیابی را تشکیل می دهد
حوزه عاطفی شامل هدفهایی است که تغییرات حاصل
در علاقه ها، نگرشها،ارزشها،و نیز رشد ارج شناسی و سازگاری را نشان می دهد.
3. حوزه روانی-حرکتی شامل هدفهایی است که با حرکت و هماهنگی قسمتهای مختلف بدن سروکار دارند.
طبقه بندی ارائه شده برای حوزه شناختی و حوزه عاطفی به صورت خلاصه در زیر مورد بحث قرار گرفته است.
حوزه شناختی
دانش ،معلومات یا آگاهی
فهمیدن
کاربستن یا کاربرد
تحلیل
ترکیب
ارزشیابی
حوزه عاطفی
دریافت کردن
پاسخ دادن
ارزش گذاری
سازمان دادن
درونی شن ارزشها(تبلور شخصیت)
سطح های طبقه بندی در حیطه شناختی
ساده
1
دانش
فهمیدن
کاربستن
تحلیل
ترکیب
پیچیده
2
3
4
5
6
داوری بر اساس شواهد بیرونی ارزشیابی
داوری بر اساس شواهد درونی
استخراج یک سلسله روابط مجرد
تولید یک نقشه
تولید یک اثر بی همتا
تحلیل اصول سازمانی
تحلیل روابط
تحلیل عناصر
برون یابی
تفسیر
ترجمه
سطح های طبقه بندی در حیطه عاطفی
ساده
1
توجه کنترل شده یا انتخاب شده
تمایل به دریافت
آگاهی
دریافت کردن
2
خشنودی در پاسخ
تمایل به پاسخ دادن
پیروی در پاسخ دادن
پاسخ دادن
3
تعهد نسبت به ارزش
ترجیح دادن یک ارزش
پذیرش یک ارزش
4
بوجود آوردن یک نظام ارزشی
درک یک ارزش
5
درونی شدن
مجموعه تعمیم یافته
ارزش گذاری
سازمان دادن
تبلور شخصیت
پیچیده
فصل چهارم
ارزشیابی و اندازه گیری
هدفهای کلی
دانش جویان پس از مطالب این فصل:
با مفاهیم اندازه گیری و ارزشیابی در آموزش آشنا می شوند
ویژگیهای ابزارهای اندازه گیری را می شناسند
انواع آزمون و ویژگیهای هر کدام را می آموزند
چگونگی استاندارد کردن آزمونهای پیشرفت تحصیلی را یاد می گیرند.
روشهای تعیین سطح دشواری و قدرت تفکیک را می آموزند
6. با مفهوم روایی و پایایی در آزمونها آشنا می شوند.
ارزشیابی و اندازه گیری
می توان به دو نوع اندازه گیری اشاره نمود.اندازه گیری نتیجه مدار و اندازه گیری تصمیم مدار.در اندازه گیری نتیجه مدار جمع آوری اطلاعات در مورد یک پدیده به منظور شناخت آن پدیده صورت می گیرد.میل و علاقه برای شناخت پدیده محرک لازم برای عمل اندازه گیری را فراهم می آورد.اندازه گیری با هدف نتیجه گیری معمولا ً در حوزه تحقیق ، بخصوص تحقیق بنیادی انجام می گیرد.
عمل اندازه گیری تصمیم مدار همیشه متوجه انجام عملی است .اطلاعات جمع آوری می شوند تا از میان راههای مختلف برای انجام یک عمل،مناسبترین راه انتخاب گردد.
در ارزشیابی دانش آموز،ارزشیابی برنامه درسی،ارزشیابی مدرسه،ارزشیابی پرسنل یا ارزشیابی از فعالیتهای دیگر، برحسب آنچه که مورد ارزشیابی قرار می گیرد،اطلاعات خاصی جمع آوری می گردد،از معیارهای خاصی برای بررسی و تفسیر داده ها استفاده می شود و تصمیم های خاصی اتخاذ می گردد .برای ارزشیابی دانش آموز ، آزمون های پیشرفت تحصیلی مهمترین وسیله اندازه گیری به شمار می آیند.
خصوصیات ابزارهای اندازه گیری
مجری ارزشیابی باید اطمینان پیدا کند که ابزار بکار گرفته شده اطلاعات مورد نیاز برای تصمیم گیری را فراهم می سازد ،به این ویژگی آزمون یا ابزار روایی گفته می شود. یعنی ابزار همان چیزی را اندازه می گیرد که انتظار می رود اندازه بگیرد
ابزار اندازه گیری نه فقط باید روا باشد بلکه باید آنچه را که اندازه می گیرد ،دقیق و با حداقل خطا اندازه گیری کند.به این ویژگی آزمون پایایی یا ثبات در اندازه گیری گفته می شود.
3. عواملی که در ارزشیابی مورد توجه قرار می گیرند معمولا ً پیچیده هستند و نمی توان آنها را با یک ابزار خاص اندازه گیری نمود.
4. ارزشیابی به انطباق هدفهای تعیین شده و بازده های پیش بینی شده و مورد انتظار محدود نمی گردد .مجری ارزشیابی باید ضمن توجه داشتن به این انطباق ارزشیابی کلیه اثرات ناشی از برنامه آموزشی جانبی و پیشبینی نشده را نیز مشاهده و اندازه گیری کند.
با توجه به نقشی که مجری ارزشیابی در جریان اجرای ارزشیابی به عهده می گیرد ،باید با شیوه های اندازه گیری از عملکرد های آموزشی و عاطفی دانش آموزان آشنایی کامل داشته باشند.مجری ارزشیابی گاه در نقشی ظاهر می شود که مسولیت تهیه یک گزارش در زمینه کارآیی یا موثر بودن برنامه اجرا شده را به عهده دارد.
روشهای اندازه گیری
برای اندازه گیری عملکرد دانش آموزان قبل از شروع برنامه آموزشی و عملکرد آنان پس از شروع و یا در پایان برنامه روشهای مختلفی وجود دارد .
آزمون و انواع آن
آزمونها را می توان به صورتهای مختلف طبقه بندی نمود.مثلا ً آزمونهای نوشتاری،شفاهی و عملی،آزمونهای گروهی و فردی یا آزمونهای استاندارد شده و معلم ساخته.کرانباخ در یک طبقه بندی آزمون ها را به دو مقوله آزمونهای عملکرد بیشینه و آزمونهای عملکرد نوعی تقسیم می کند.عملکرد بیشینه مسائل مربوط به حوزه شناختی و آزمونهای عملکرد نوعی مسائل مربوط به حوزه عاطفی را اندازه می گیرند.
آزمونهای عملکرد بیشینه را می توان به سه دسته تقسیم نمود:
آزمونهای پیشرفت تحصیلی،آزمون های استعداد وآزمونهای هوش .آزمونهای پیشرفت تحصیلی توانایی فرد را در زمان حال اندازه می گیرند.این آزمونها آنچه را که فرد در رابطه با یک موضوع درسی فراگرفته اندازه می گیرد.
آزمونهای استعداد با توجه به میزان یادگیری و توانایی فعلی فرد ،ظرفیت یا آمادگی وی را در یک فعالیت یا موضوع خاص در آینده پیشبینی می کنند.آزمونهای هوش ترکیبی از آزمون های پیشرفت تحصیلی و استعداد هستند.این آزمونها از یک طرف یادگیری ها و مهارتهای کسب شده را اندازه می گیرند و از طرف دیگر عملکرد فرد را در آینده پیشبینی می کنند.
راهبردهای ارزشیابی
پاپهام معتقد است که دو راهبرد خاص برای انجام ارزشیابی وجود دارد .آزمونهای ملاکی و آزمونهای هنجاری .ولی فنون به کار گرفته شده در این دو راهبرد کم و بیش یکسان هستند. این فنون را می توان در دو مقوله کلی طبقه بندی نمود: آزمونهای پاسخ گزین و آزمونهای پاسخ نگار.
آزمونهای صحیح –غلط،جورکردنی و چند گزینه ای اشکال مختلف سوالهای پاسخ گزین هستند .در آزمونهای پاسخ نگار پاسخ دهنده خود پاسخ سوال را فراهم می آورد .برحسب طول پاسخ مورد انتظار،این آزمونها را به آزمونهای کوتاه پاسخ یا کامل کردنی،پاسخ محدود و پاسخ باز تقسیم می کنند.بدیهی است که این فنون را می توان به صورتهای دیگر نیز طبقه بندی نمود.مثلا ً آزمونهای عینی یا آزمونهایی که نمره گذاری آنها عینی و مستقل از نظر و قضاوت نمره گذار صورت می گیرد.و آزمونهای ذهنی که
نمره گزاری آنها ذهنی و تحت تاثیر قضاوت ذهنی فرد نمره گزار قرار می گیرد.
آزمونهای هنجاری
به آزمونی که نتایج آن به صورت هنجاری تفسیر می شود آزمون هنجاری یا هنجار مدار و به آزمونی که نتایج آن به صورت مطلق تفسیر می شود،آزمون ملاکی یا ملاک دار گفته می شود .در آزمون هنجاری تفسیر نمره یک تفسیر نسبی است.نمره هر فرد با نمره سایر افراد گروه مقایسه و بر اساس این مقایسه نمره فرد مورد قضاوت قرار می گیرد.
در این مقایسه معلوم می شود که یک فرد در مقایسه با سایر افراد چه کرده است.معیار مقایسه معمولا ً معدل یا متوسط عملکرد یک گروه مشخص و تعریف شده است که با شرایطی کاملا ً مشابه فرد مورد نظر در آزمون خاص شرکت نموده اند.به این گروه هنجار یا نرم گفته می شود.
آزمون هنجاری ،کلی و جامع بوده و یک حوزه وسیع از محتوی یا مهارتهای مورد نظر را تحت پوشش قرار می دهند. سوالهای این آزمون از یک سطح دشواری نسبتا ً متوسط برخوردار هستند و سوال مناسب به سوالی گفته می شود که حدود 50 درصد پاسخدهندگان به آن پاسخ صحیح بدهند.با توجه به سطح دشواری سوالها پراکندگی نمرات حاصل از آزمون های هنجاری نسبتا ً زیاد است.
استاندارد کردن آزمون و هنجار یابی
فرایند تهیه یک آزمون استاندارد را می توان به پنج مرحله تقسیم نمود .سه مرحله از این 5 مرحله همانند هر آزمون معلم ساخته عبارتند از تهیه محتوی یا سوالهای آزمون،اجرای آزمون و تصحیح و نمره گزاری. با وجود این هریک از این سه مرحله در عمل با آزمون معلم ساخته تفاوت دارند. سوالهای آزمون استاندارد شده با دقت و صرف وقت و نیروی بیشتری تهیه می شوند.
علاوه بر سه مرحله بالا افراد شرکت کننده در آزمون اولیه به صورتی انتخاب می شوند که معرف جامعه مورد نظر باشند و برای تسهیل در تفسیر نمره های کسب شده،هنجار یابی صورت می گیرد.دو مرحله انتخاب نمونه معرف و هنجار یابی به علت اختصاص داشتن به آزمونهای هنجاری باید بیشتر مورد توجه قرار گیرند.
پس از اجرای فرم های تهیه شده روی گروه نمونه ،پاسخ آزمودنی ها جمع آوری و نتایج هر یک از سوالهای آزمون مورد تجزیه و تحلیل قرار می گیرد.سوالهای ضعیف و نامناسب فرم اولیه حذف می شوند و توزیع نمره های خام آنها تشکیل می گردد.نمره های خام به کمک روشهای آماری به نمره های مشتق یا هنجار-هنجار نسبی،هنجار کلاسی،رتبه درصدی یا نمره های معیار –تبدیل می شوند.
چگونگی تبدیل نمره های خام به نمره های هنجاری
ابتدا توزیع فراوانی نمره های خام از طریق طبقه بندی نمره های کسب شده تشکیل می گردد
فراوانی تراکمی پایینتر از حد میانی هر طبقه مشخص می شود.
رتبه درصدی فراوانی تراکمی محاسبه شده برای هریک از طبقات، از طریق تقسیم فراوانی تراکمی آن طبقه بر تعداد کل افراد مورد مطالعه ضرب در صد محاسبه می شود.
برای تفسیر یکسان از نمره های کسب شده،این نمره ها به نمره های معیار با مقیاس اندازه گیری فاصله ای تبدیل می شوند. تبدیل نمره های خام به نمره های معیار یک تبدیل خطی است که بدون تغییر در شکل پراکندگی، توزیع نمره ها ،میانگین و انحراف معیار توزیع تغییر پیدا می کند.
اولین مرحله در تبدیل نمرات خام به نمره های معیار ،تبدیل نمرات خام به نمرات استاندارد است.با استفاده از فرمول زیر و با در اختیار داشتن میانگین و انحراف معیار نمره های خام این تبدیل صورت می گیرد.
نمره استاندارد=
در این فرمول =Xنمره خام،X=میانگین توزیع نمره های خام،S=انحراف معیار توزیع نمره های خام .
X-X
S
–
بدین ترتیب می توان نمرات معیاری فراهم آورد که از نظر میانگین و انحراف معیار با هم تفاوت داشته باشند.ولی توزیع پراکندگی نمره ها در تمام آنها یکسان باشد.تبدیل نمره های خام به نمره های معیار نرمال از طریق محاسبه رتبه های درصدی نمره های خام انجام می گیرد. با استفاده از جدول سطح زیر منحنی نرمال نمره استاندارد معادل هریک از رتبه های درصدی محاسبه می شود.
تحلیل سوالها
این بررسی با دو هدف صورت می گیرد .
شناخت وضعیت عملکرد افراد پاسخ دهنده در هر سوال ،به منظور پی بردن به مشکلات سوالهای آزمون و مشکلات آموزش
انتخاب سوالهای مناسب و تجدید نظر در سوالهای متوسط برای استفاده مجدد.
از طریق تحلیل سوالهای آزمون می توان یک تفسیر بهتر و دقیقتر از نتایج آزمون فراهم آورد.
سطح دشواری و قدرت تفکیک
سطح دشواری هر سوال عبارت است از نسبت یا درصد دانش آموزانی که به سوال پاسخ صحیح داده اند.
سطح دشواری هر سال عبارت است از نسبت درصد پاسخهای صحیح گروه قوی و ضعیف به کل افراد دو گروه
سطح دشواری سوالهای پاسخ گزین=
تعداد پاسخهای صحیح گروه ضعیف +تعداد پاسخهای صحیح گروه قوی
تعداد هر دو گروه
100×
در مورد سوالهای پاسخ نگار چون هر فرد می تواند از نمره تعیین شده برای یک سوال ،تمام یا بخشی از نمره را کسب کند در نتیجه محاسبه سطح دشواری به صورت زیر انجام می پذیرد
سطح دشواری سوالهای پاسخ نگار=
مجموع نمره های گروه ضعیف +مجموع نمره های گروه قوی
بارم سوال×تعداد دو گروه
100×
در آزمونهای هنجاری قدرت تفکیک سوال عبارت است از میزان قدرت سوال در تفکیک دانش آموزان دارای نمره بالا در آزمون از دانش آموزان دارای نمره پایین در آزمون.به یک سوال که از قدرت تفکیک مناسب برخوردار باشد،در مجموعه دانش آموزان دارای نمره بالا در آزمون پاسخ صحیح و دانش آموزان دارای نمره پایین در آزمون پاسخ غلط میدهند.
قدرت تفکیک سوال با استفاده از روش همبستگی دو رشته ای نقطه ای محاسبه می شود و دامنه آن بین 1- و 1+ می باشد.ضریب همبستگی مثبت نشان می دهد که سوال همان چیزی را اندازه می گیرد که آزمون اندازه می گیرد. هرچه شدت همبستگی به 1+ نزدیک تر باشد یکسانی عملکرد سوال و آزمون نیز بیشتر می شود.
ضریب همبستگی صفر نشان می دهد که عملکرد دانش آموزان در سوال با عملکرد آنها در کل آزمون بی ارتباط است .چنین سوالی به نمره آزمون کمک نمی کند و در استفاده مجدد از آزمون ، این قبیل سوال ها حذف می شوند.ضریب همبستگی منفی نشان می دهد که موفقیت در سوال پیشبینی کننده عدم موفقیت یا نمره پایین در آزمون است.چنین حالتی فقط زمانی رخ می دهد که سوال برای دانش آموزان قوی گمراه کننده باشد.این قبیل سوالها نشان دهنده مشکل در گزینه های سوال،متن سوال و یا آموزش می باشند.
در آزمون هنجاری قدرت تفکیک ر سوال پاسخ گزین عبارت است از:
قدرت تفکیک سوال پاسخ گزین=
و در سوالهای پاسخ نگار
قدرت تفکیک سوال پاسخ نگار=
تعداد پاسخ های گروه ضعیف-تعداد پاسخهای صحیح گروه قوی
نصف تعداد دو گروه
مجموع نمره های گروه ضعیف-مجموع نمره های گروه قوی
بارم سوال×نصف تعداد دو گروه
با توجه به شاخص قدرت تفکیک می توان سوالهای یک آزمون را ارزشیابی نمود:
قدرت تفکیک 4/0 و بیشتر =سوال خیلی خوب
قدرت تفکیک 3/0 تا 39/0 =سوال مناسب
قدرت تفکیک 2/0 تا 29/0 =سوال متوسط(نیاز به اصلاح و تجدید نظر)
قدرت تفکیک 19/0 و کمتر =سوال ضعیف (اصلاح کامل یا حذف)
بین سطح دشواری و قدرت تفکیک یک سوال رابطه وجود دارد . انتخاب یا حذف یک سوال باید با توجه به این سه شاخه صورت گیرد:
1. اگر شاخص دشواری حدود صفر باشد،سوال فاقد قدرت تفکیک خواهد بود در چنین حالتی یا مطلب در کلاس تدریس نشده است،یا متن سوال مبهم و نارسا بوده است.اگر مطلب تدریس شده باشد احتمالا ً مشکل در ارائه متن سوال یا گزینه های پیشنهادی است.
2. اگر شاخص قدرت تفکیک منفی باشد،علت را باید در گزینه های سوال جستجو نمود.در هر صورت سوالهای باقدرت تفکیک منفی فاقد ارزش هستند و باید حذف شوند.
3. اگر شاخص قدرت تفکیک مثبت و پایین باشد ،به سطح دشواری سوال توجه کنید .سوالهای خیلی ساده یا خیلی مشکل قدرت تفکیک ضعیف دارند.اگر سطح دشواری سوال مطلوب باشد به الگوی پاسخها و متن سوال توجه کنید.
پایایی و روایی آزمونهای هنجاری
پایایی یک آزمون بیانگر ثبات در اندازه گیری چیزی است که آزمون اندازه می گیرد. در آزمونهای هنجاری مفهوم پایایی با پراکندگی در نمره آزمون ارتباط دارد.
ضریب پایایی معمولا ً با استفاده از روشهای همبستگی یا روشهای کودر و ریچاردسون محاسبه می شود.
در نظریه های کلاسیک آزمونهای روانی ، پایایی عبارت است از نسبت واریانس واقعی( S) به واریانس مشاهده شده( S)و روایی عبارت است از همبستگی بین نمره دانش آموزان در آزمون مورد نظر و آزمون ملاک.به عبارت دیگر روایی عبارت است از واریانس مشترک بین دو آزمون
2
t
2
o
فرض کنید واریانس مشاهده شده نمره های آزمون( S) ،واریانس مشاهده شده آزمون ملاک(S ) و کواریانس و یا واریانس مشترک دو آزمون(S ) باشد.هر اندازه گیری حداقل در علوم رفتاری با مقداری خطا همراه است،که به آن واریانس خطا(S )گفته می شود.
2
o
2
c
2
co
2
e
واریانس واقعی که در بالا از آن نام برده شد،خود از دو قسمت واریانس مشترک و واریانس اختصاصی آزمون تشکیل می شود.
S =S +S در نتیجه واریانس مشاهده شده یک آزمون از سه بخش S = S +S +S تشکیل می شود.
2
2
2
t
co
so
2
2
2
2
o
co
so
e
بنابراین ضریب پایایی برابر است با :
r = پایایی
S
S
2
2
t
o
هرچه مقدار واریانس خطا بیشتر باشد مقدار صورت کسر به مقدار مخرج کسر نزدیک تر می شود،درنتیجه ضریب پایایی یا دقت اندازه گیری افزایش می یابد.از طرف دیگر روایی برابر است با:
rروایی =
S
S
2
2
co
o
روایی یک آزمون از خطاهای منظم و نظام داری که به طور ثابت باعث کاهش نمره آزمودنی ها می شوند تاثیر می پذیرند . درحالی که پایایی آزمون از خطاهای نامنظم و تصادفی که گاه نمره را افزایش و گاه کاهش می دهند تاثیر می پذیرد.بالا بودن مقدار شاخص روایی نشان می دهد که خطاهای منظم کاهش یافته اند و بالا بودن مقدار شاخص پایایی نشان می دهد که خطاهای تصادفی کاهش یافته اند.
خطاهای منظم و تصادفی از عوامل مختلفی تاثیر می پذیرند .این عوامل عبارتند از :
عوامل مربوط به آزمون،نامناسب بودن سوالهای آزمون برای گروه مورد بررسی،مبهم بودن متن سوالهای آزمون ، نامناسب و یا گمراه کننده بودن گزینه های سوالها
عوامل مربوط به اجرای آزمون ،عدم پیروی از دستورالعمل های تهیه شده،یکسان نبودن شرایط محیطی اجرای آزمونها،عدم رعایت وقت تعریف شده یا تقلب در آزمون
3. عوامل مربوط به افراد،عدم آمادگی جسمی ،خستگی ، بی خوابی و عدم انگیزه کافی برای پاسخگویی به سوالها
آزمونهای هنجاری و ارزشیابی آموزشی
آزمونهای هنجاری به منظور پی بردن به میزان عملکرد تحصیلی دانش آموزان در مقایسه با سایر دانش آموزان تهیه می شوند.به طور کلی آزمونهای هنجاری در موقعیتهای زیر به اهداف ارزشیابی آموزشی کمک می کند.
انتخاب افراد شرکت کننده در یک برنامه با سطح توانایی متفاوت
زمانی که برای اجرای یک برنامه آموزشی جدید در آغاز برنامه به گروههای مشابه نیاز داشته باشیم.
همتا سازی با توجه به کوچکترین واحد مطالعه ممکن ،ممکن است با استفاده از دانش آموز ،کلاس یا مدرسه انجام پذیرد
3. مقایسه عملکرد افراد شرکت کننده در برنامه آموزشی با عملکرد گروه هنجار ملی یا منطقه ای.
فصل پنجم
ارزشیابی و اندازه گیری”آزمونهای ملاکی“
هدفهای کلی
دانشجویان پس از مطالعه مطالب این فصل:
به عوامل موثر در پیدایش آزمونهای ملاکی پی می برند.
آزمونهای ملاکی را می شناسند.
تفاوتهای آزمون ملاکی و آزمون هنجاری را تشخیص می دهند.
روشهای تعیین سطح دشواری و قدرت تفکیک آزمونهای ملاکی را می آموزند.
5. محاسبه روایی و پایایی در آزمونهای ملاکی را یاد می گیرند
آزمونهای ملاکی
زمینه های پیدایش آزمونهای ملاکی:
گلسر،که خود در فعالیتهای آموزش برنامه ای شرکت داشت، نامناسب بودن آزمونهای هنجاری و لزوم استفاده از راهبرد های نو یعنی آزمونهای ملاکی برای اندازه گیری یافته های حاصل از آموزش را برای اولین بار مطرح نمود.
طبقه بندی هدفهای تربیتی توسط بلوم و همکاران و همچنین توجه به تدوین هدفهای آموزشی توسط میگر را می توان دو عامل دیگر در رشد و تکامل آزمونهای ملاکی دانست.
آزمون ملاکی و کاربرد آن
در آغاز پیدایش راهبرد جدید اندازه گیری و به دنبال استفاده از واژه معیار یا ملاک توسط گلسر،در زمینه ملاک یا آزمون ملاکی چیست تعاریف مختلفی ارائه گردید.گلسر با توجه به وابسته بودن آزمونهای هنجاری به یک معیار نسبی ، آزمون های ملاکی را آزمون هایی می داند که به یک معیار مطلق وابسته هستند.
در میان تعاریف ارائه شده شاید بتوان تعریف پاپهام را به عنوان یک تعریف کامل قبول نمود.آزمون ملاکی آزمونی است که برای تعیین وضعیت یک فرد در یک حوزه رفتاری کاملا ً مشخص و تعریف شده مورد استفاده قرار می گیرد.
آزمونهای ملاکی و هنجاری
آزمونهای ملاکی و هنجاری را می توان از جهات مختلف با یکدیگر مقایسه نمود و تفاوت آنها را بیان نمود .گرانلند و لین تفاوت عمده این دو آزمون را در تفسیر نتایج حاصل از آزمون می دانند.آنها معتقد هستند که تنها در تهیه سوالهای آزمون و استفاده از نتایج آزمون می توان به تفاوت این دو آزمون پی برد.
برای آشنایی بیشتر با تفاوت این دو آزمون به چند تفاوت قابل ذکر اشاره می کنیم:
1. این دو آزمون هرکدام یافته های حاصل از نتایج آزمون را به شیوه ای خاص تفسیر می کنند.آزمونهای ملاکی از معیار مطلق و از قبل تعیین شه استفاده می کنند.نتایج حاصل از آزمونهای ملاکی را می توان به صورتهای مختلف تفسیر نمود:الف)توصیف تکلیف یادگیری خاص که فرد می تواند انجام دهد .ب)مشخص کردن درصد تکالیفی که فرد صحیح انجام می دهد.ج)مقایسه عملکرد در آزمون
با یک معیار و تصمیم گیری در مورد رسیدن یا عدم رسیدن به حد تسلط
2. آزمونهای هنجاری معمولا ً کلی و جامع هستند و یک حوزه وسیع محتوی تکالیف یادگیری را در بر می گیرند ولی آزمونهای ملاکی معمولا ً یک حوزه محدود و مشخص از محتوی و تکالیف یادگیری را در بر می گیرند.
3. از آزمونهای هنجاری برای اندازه گیری توانایی دانش آموزان درپایان اجرای برنامه ارزشیابی پایانی و از
آزمونهای ملاکی برای اندازه گیری توانایی دانش آموزان در جریان اجرای برنامه –ارزشیابی تکوینی-استفاده می شود.
4. در آزمونهای هنجاری به علت گسترده بودن محتوی یا رفتارهای مورد اندازه گیری ،تعداد سوالهای مطرح شده برای هر هدف محدود و گاه صفر است.در حالی که در آزمونهای ملاکی به عات محدود بودن محتوی یا رفتارهای مورد اندازه گیری هر هدف آموزشی با چندین سوال مورد پرسش قرار می گیرد.
5. در آزمونهای هنجاری چون عملکرد هر فرد با عملکرد سایر افراد مقایسه می شود،سوال و آزمون مناسب سوال و آزمونی خواهد بود که تفاوت بین افراد را بهتر و مشخص تر نشان دهد.ولی در آزمونهای ملاکی چون عملکرد هر فرد با توانایی ها و مهارتهای مشخص –هدفها-مقایسه می شود،گسترده بودن پراکندگی نمره ها در توزیع مورد توجه قرار نمی گیرد و اصولا ً مطلوب و مورد انتظار نمی باشد.
6. پراکندگی نمره ها یا تغییر پذیری نمره ها در تئوری روان سنجی کلاسیک برای محاسبه ضرایب پایایی و روایی آزمون از اهمیت بسیار برخوردار است.لذا در آزمونهای ملاکی که نمره ها از پراکندگی کافی برخوردار نیستند نمی توان از روشهای متداول برای محاسبه ضریب پایایی و روایی استفاده نمود.
7. آزمونهای هنجاری بیشتر در پروژه های تربیتی مورد استفاده قرار می گیرد .در حالی که آزمونهای ملاکی بیشتر در ارزشیابی آموزشی مورد استفاده قرار می گیرند.
خصوصیات آماری آزمونهای ملاکی
الف)سطح دشواری سوالها
در آزمونهای ملاکی،سطح دشواری از طریق تعیین نسبت پاسخهای صحیح داده شده به سوال محاسبه می گردد.
برای بررسی عملکرد سوالها و عملکرد افراد شرکت کننده در آزمون،نتایج حاصل از اجرای آزمون در یک جدول تنظیم می گردد.ضمنا ً برای بررسی سریع تر و راحتتر،سوالهای مربوط به هر هدف در ستونهای همجوار نوشته می شود.
پس از تکمیل جدول،می توان به دو سوال زیر پاسخ گفت:
عملکرد هر فرد در هر سوال،هر هدف آموزشی و کل آزمون چگونه است؟
عملکرد تمام افراد شرکت کننده در برنامه ،در هر سوال و هر هدف آموزشی چگونه است؟
نتایج حاصل از تجزیه و تحلیل عملکرد دانش آموزان در سوالهای آزمون و هدفهای آموزشی به معلمان،مدیران و عاملان ارزشیابی امکان می دهد تا:
در مورد هر فرد تصمیم های آموزشی مناسب اتخاذ نمایند
نکات ضعف و نارسایی های آموزشی در هر قسمت و علت یا عوامل عدم موفقیت را شناسایی کرده و برای برطرف کردن آنها تصمیمهای مناسب اتخاذ نمایند.
ب)قوه تفکیک سوال
رابطه بین عملکرد افراد در آزمون با عملکرد افراد در یک سوال آزمون قوه تفکیک سوال را نشان می دهد.هرچه میزان این رابطه به 1 نزدیکتر باشد،قدرت سوال در تفکیک گروه موفق و ناموفق بیشتر و هرچه میزان رابطه به صفر نزدیکتر باشد،قدرت سوال در تفکیک دو گروه ضعیفتر خواهد بود.
برای محاسبه قوه تفکیک سوال یک جدول 2×2 برای چهار ترکیب عملکرد در کل آزمون و عملکرد سوال تشکیل می گردد.جدول زیر ترکیب چهار حالتی از ناموفق در آزمون، موفق در سوال( a)،موفق در آزمون،موفق در سوال(b)، ناموفق در آزمون،ناموفق در سوال(c)،وموفق در آزمون، ناموفق در سوال(d)را نشان می دهد.
موفق
ناموفق
موفق
ناموفق
سوال
آزمون
a
b
c
d
N
a+b
c+d
a+c
b+d
پس از تکمیل جدول با استفاده از فرمول زیر قوه تفکیک هریک از سوالهای آزمون ملاکی محاسبه می گردد.توجه کنید که برای هر سوال باید جدول بالا تهیه شود.
قوه تفکیک=
b
b+d
–
a
a+c
شاخص تاثیر آموزش با استفاده از فرمول زیر محاسبه می شود:
شاخص تاثیر آموزش=Pآزمون نهایی-Pپیش آزمون
آزمون نهایی P
عبارت است از نسبت پاسخهای صحیح سوال درآزمون نهایی
پیش آزمونP
عبارت است از نسبت پاسخهای صحیح سوال در پیش آزمون
شاخص تاثیر آموزش را از فرمول زیر نیز می توان محاسبه کرد:
شاخص تاثیر آموزش=
RAعبارت است از تعداد پاسخهای صحیح سوال در آزمون نهایی
RBعبارت است از تعداد پاسخهای صحیح سوال در پیش آزمون
Nعبارت است از تعداد افراد شرکت کننده در آزمون
RA-RB
N
پایایی و روایی آزمونهای ملاکی
در آزمونهای هنجاری،پایایی نمره های کسب شده با استفاده از روش ضریب همبستگی محاسبه می شود و ضرایب همبستگی از میزان تغییر پذیری نمره ها تاثیر می پذیرد.ولی در آزمونهای ملاکی ،پایایی تصمیم های اتخاذ شده بر اساس نتایج آزمون محاسبه می شود و میزان پراکندگی حاصل از اجرای آزمون نیز معمولا ً ناچیز است.
در آزمونهای ملاکی بر اساس نتایج حاصل از آزمون،در مورد عملکرد افراد شرکت کننده در برنامه آموزشی و همچنین موفقیت یا عدم موفقیت برنامه آموزشی در رسیدن به هدفهای تعیین شده تصمیم گرفته می شود.
ضریب پایایی در تصمیم گیری برای یک آزمون ملاکی عبارت است از درصد افراد آزمودنی که در هر دو بار اجرای آزمایش موفق یا ناموفق بوده اند.برای محاسبه ضریب پایایی تصمیم گیری از روشهای آمار غیر پارامتر یک نظیر ضریب فای یا مجذور کای نیز استفاده می شود.
مقدار ضریب پایایی بین صفر تا 1 در نوسان است.صفر یعنی بی ثباتی کامل در تصمیم گیری و 1 یهنی ثبات کامل در تصمیم گیری .هرچه مقدار محاسبه شده به یک نزدیکتر باشد،ثبات در تصمیم گیری بیشتر است.
به این ویژگی آزمون”آنچه قرار است اندازه بگیرد،اندازه می گیرد و برای هدفی که طراحی و تهیه شده مناسب است.“ روایی آزمون گفته می شود.اگرچه مفهوم روایی در آزمونهای مختلف یکسان است،ولی به علت ویژگیهای خاص آزمونهای ملاکی،در این آزمونها معمولا ً روایی محتوی و روایی پیشبین تعیین می گردد.
فصل ششم
ارزشیابی و اندازه گیری
”اندازه گیری عملکردهای عاطفی“
هدفهای کلی
دانشجویان پس از مطالعه مطالب این فصل:
تعریف ویژگی های آموزشی را می آموزند
روشهای جمع آوری اطلاعات در زمینه رفتارهای عاطفی را می آموزند
با ویژگیهای ابزارهای اندازه گیری رفتارهای عاطفی آشنا می شوند.
تفاوت مقیاسهای درجه بندی را یاد می گیرند.
چگونگی محاسبه نگرش دانش آموزان را به کمک ابزارها و مقیاسهای درجه بندی می آموزند.
اندازه گیری عملکردهای عاطفی
ویژگیهای عاطفی کیفیتهایی هستند که شیوه خاص احساس یا بیان عواطف فرد را منعکس می سازند.ویژگیهای عاطفی دارای سه خصیصه هستند:
شدت که میزان یا قدرت احساس را بیان می کند
جهت که به جنبه مثبت،خنثی یا منفی بودن احساس اشاره می کند
هدف که به موضوع،رفتار یا فکری که احساس به طرف آن کشیده می شود اشاره می کند.
ویژگیهای عاطفی را می توان در قالب سه مفهوم: نگرشها، علاقه ها و ارزشها مورد بررسی قرار داد.
نگرشها احساس فرد نسبت به یک نهاد اجتماعی،سنت موسسه ، گروه قوی یا نژادی را منعکس می سازد.ولی علاقه ها احساس فرد نسبت به یک فعالیت را بیان می کنند.نگرش یک قضاوت است در حالی که علاقه فقط نشان می دهد که فرد انجام یک فعالیت را بر انجام فعالیتهای دیگر ترجیح می دهد و حاضر است انرژی و وقت خود را در راه انجام فعالیت مورد علاقه اش بکار گیرد.
ارزش یک باور داشت دیرپا است که از نظر شخصی یا اجتماعی یک شیوه رفتاری را بر شیوه رفتاری دیگر ترجیح می دهد.جهت ارزش می تواند مثبت یا منفی باشد و شدت آن با توجه موقعیت و ارزش مورد نظر می تواند کم یا زیاد باشد.
ویژگی ارزشها
ارزشها باور داشتهایی هستند در مورد چه چیز مطلوب است و چه چیز اهمیت دارد
ارزشها بر رفتارها،نگرشها و علاقه ها اثر گذاشته و آنها را هدایت می کنند.
ارزشها دیرپا هستند و در یک زمان نسبتا ً طولانی بدون تغییر باقی می مانند.
روشهای جمع آوری اطلاعات در زمینه رفتارهای عاطفی
روشهای کمی (جمع آوری اطلاعات به صورت عددی)
روشهای کیفی(جمع آوری اطلاعات به صورت کلامی)
در مواردی که اطلاعات را فرد فراهم می کند،فرض می شود که:
وی توانایی خواندن و درک کردن سوالهای مطرح شده را دارد
از احساس خود در زمینه سوالهای مورد پرسش آگاه است
احساس واقعی خود را بیان می کند.
مقایسهای درجه بندی رفتار
مقیاسها معمولا ً به دو صورت استفاده می شوند:
گزارشهای خود سنجی
گزارش از دیگران
ساده ترین شکل مقیاس درجه بندی درجه بندی لیکرت است.
مراحل تهیه یک مقیاس درجه بندی لیکرت:
موضوع مورد نظر را به صورت روشن و دقیق بیان کنید
خصوصیات یا ویژگیهای عمده هر یک از موضوعات مورد اندازه گیری را مشخص کنید
برای هر خصیصه یا ویژگی یک عبارت بنویسید و برای آن یک پاسخ درجه بندی شده تهیه کنید.
4. جهت عبارتهای مقیاس را مشخص کنید.یک عبارت ممکن است جنبه مثبت یا جنبه منفی داشته باشد
5. دستور العمل استفاده از مقیاس را مشخص کنید
مقیاس لیکرت نظیر یک خط کش به واحدهای کوچک تقسیم می شود.با این تفاوت که فاصله همه واحدها در روی خط کش یکسان است ولی در مقیاس لیکرت فاصله واحدها یکسان نیست.
1
2
3
4
5
با اولین برخورد
با مشکل از فعالیت
کنار می کشد.
پس از مدت
کوتاهی تلاش
تسلیم می شود
با وجود مشکل
بودن فعالیت
به تلاش ادامه
می دهد.
حتی بعد
از اینکه
سایر دوستان
او از فعالیت
کنار می کشند
به فعالیت
ادامه می دهد
هرگز تا معلم او را
متوقف نکند از فعالیت
دست نمی کشد
چگونگی محاسبه نمره فرد و نمره گروه در مقیاس درجه بندی
نمره هر فرد در مقیاس درجه بندی برابر است با مجموع نمره های وی در تمام سوالها تقسیم بر تعداد سوالها .با توجه به نمره کسب شده توسط فرد،در مورد مثبت یا منفی بودن نگرش وی و یا تمایل و عدم تمایل وی قضاوت می شود.در مقیاسهای 5 درجه ای که نمره 3 معدل یا نگرش خنثی،نمره بیش از 3 بیانگر جهت مثبت و نمره کمتر از 3 بیانگر جهت منفی نگرش است.هرچه مقدار نمره به 5 نزدیکتر باشد،شدت نگرش مثبت بیشتر و هرچه به 1 نزدیکتر باشد شدت نگرش منفی بیشتر است.
مقیاس دو درجه ای
مقیاس دو درجه ای حالت خاصی از مقیاس لیکرت است با این تفاوت که در این مقیاس برای هر عبارت 2 پاسخ بلی یا موافق و خیر یا مخالف در نظر گرفته می شود.مثلا ً
کلاس درس برای من جالب است
در کلاس درس احساس خستگی می کنم
برای رفتن به کلاس درس دقیقه شماری می کنم
آرزو می کنم کلاس دیر به پایان برسد
بلی(موافقم)
خیر(مخالفم)
مشاهده و مصاحبه در ارزشیابی کیفی
برای روش مشاهده مستقیم و تماس نزدیک با برنامه،مجریان و شرکت کنندگان برنامه چندین امتیاز ذکر شده است بعضی از این امتیازها عبارتند از:
از طریق مشاهده دست اول و مستقیم برنامه،عامل ارزشیابی می تواند زمینه ای را که برنامه در آن به اجرا در می آید درک کند.
عامل ارزشیابی از طریق کسب تجارب دست اول می تواند به شیوه استقرایی به مطالعه و شناخت برنامه مورد ارزشیابی بپردازد.
3. افرادی که در درون برنامه و مستقیما ً در جریان اجرای برنامه فعالیت دارند،گاه در اثر عادت کردن به موقعیتهای اجرای برنامه،بسیاری از امور را طبیعی و عادی پنداشته و حتی در بحثهای دوستانه و غیر رسمی نیز ممکن است به این مسائل اشاره نکنند،زیرا در زمینه این مسائل چیزی ادراک نکرده اند که بازگو نمایند.
4. اعضای تیم مجری برنامه معمولا ً کمتر تمایل دارند که واقعیتهای موجود درباره برنامه را به صورت عریان بازگو کنند.
عامل ارزشیابی-ابزار جمع آوری اطلاعات-گاه مصاحبه گر است و با افراد مختلف که با فعالیت مورد ارزشیابی ارتباط دارند به صحبت می نشینند.
محاوره های غیر رسمی بخشی از مشاهده همراه با مشارکت هستند.مشاهده گر علاوه بر دو نقش قبلی خویش-شرکت در برنامه و مشاهده-برحسب ضرورت با افراد شرکت کننده در برنامه یا مجریان برنامه به محاوره و گفتگو می نشینند.
در مصاحبه استاندارد شده پاسخ آزاد، سوالها از قبل دقیقا ً بررسی می شوند و شکل نهایی و تایید شده هر سوال در قالب یک جمله پرسشی در اختیار مصاحبه گر قرار می گیرد. مصاحبه گر نیز در جریان اجرای مصاحبه این سوالها را طبق نظم و تربیت مشخص شده،به ترتیب با مصاحبه شونده در میان می گذارد.مصاحبه شونده در ارائه پاسخ خویش آزادی عمل کافی دارد و می تواند آنچه را که خود می خواهد بیان کند.
پاتون برای این شیوه مصاحبه سه دلیل عمده ذکر کرده است:
استفاده کنندگان از این اطلاعات و کسانی که در مورد برنامه ارزشیابی شده تصمیم می گیرند می توانند سوالها را بررسی و آزمایش کنند
در شرایطی که از چند نفر مصاحبه گر استفاده می شود،این شیوه باعث می شود که تفاوت بین مصاحبه گران به حداقل ممکن کاهش یابد.
چون مصاحبه کاملا ً تنظیم شده است،از وقت اجرای مصاحبه دقیقا ً استفاده می شود.
برای انجام یک مشاهده کنترل شده،معمولا ً مراحل زیر صورت می گیرد.
مشخص ساختن هدف مشاهده
تهیه لیستی از رفتارهای فرد که بیانگر دیدگاه مثبت و منفی فرد نسبت به موضوع مورد مشاهده باشد.
در صورت امکان برای سرعت بخشیدن به عمل ثبت رفتارهای مشاهده شده،این رفتارها برحسب احتمال وقوع تنظیم شوند.
شیوه ثبت رفتار مشاهده شده مشخص می گردد.
فصل هفتم
طرحهای ارزشیابی
هدفهای کلی
دانشجویان پس از مطالعه مطالب این فصل:
با مفهوم طرح ارزشیابی آشنا می شوند.
اجزاء اساسی یک طرح ارزشیابی را می شناسند
انواع مختلف طرحهای ارزشیابی را می آموزند
با روشهای کنترل عوامل تهدید کننده یافته های ارزشیابی آشنا می شوند
کاربرد طرح ارزشیابی مناسب برای موفقیت های خاص را یاد می گیرند
طرحهای ارزشیابی
اجزای یک طرح ارزشیابی عبارتند از:
بیان اطلاعات مورد نیاز و زمان جمع آوری این اطلاعات
تعیین افرادی که در برنامه شرکت می کنند و برای جمع آوری اطلاعات مورد مشاهده و اندازه گیری قرار می گیرند
روایی چیست؟
انواع روایی:
روایی داخلی
روایی خارجی
عوامل تهدید کننده که امکان نتیجه گیری از مطالعات ارزشیابی را می کاهند عبارتند از:
تاریخچه
بلوغ یا بالیدن
آزمون
ابزار
گزینش
افت یا ترک تحصیلی
انتشار یا گسترش عمل آزمایشی
رنجش و تضعیف روحیه یادگیرندگان
کنترل عوامل تهدید کننده
برای جلوگیری از تاثیر عوامل تهدید کننده بر یافته های حاصل از مطالعات ارزشیابی دو روش وجود دارد:
استفاده از گروه مقایسه غیر همتا
استفاده از گمارش تصادفی آزمودنیها در گروههای مختلف
طرحهای ارزشیابی
اسامی طرحهای بالا عبارتند از:
طرح پیش آزمون-پس آزمون با گروه گواه واقعی
طرح گروه گواه واقعی با پس آزمون
طرح پیش آزمون-پس آزمون با گروه گواه ناهمتا
طرح سریهای زمانی تک گروهی
طرح سریهای زمانی با گروه گواه ناهمتا
طرح پیش آزمون-پس آزمون با یک گروه
طرح دو گروه ناهمتا با پس آزمون
طرح مورد پژوهی تک گروهی
طرح شماره1:پیش آزمون-پس آزمون با گروه گواه واقعی
طرح واره شماره 1:
O2E X O1E R E
O2C – O1C R C
پس آزمون
عمل آزمایشی
پیش آزمون
گمارش تصادفی
زمان
طرح شماره2:طرح گروه واقعی با پس آزمون
طرحواره شماره2:
O2E X R E
O1C – R C
گمارش تصادفی عمل آزمایشی پس آزمون
زمان
طرح شماره 2 را می توان با افزایش تعداد گروهها به صورت گسترده تر نیز مورد استفاده قرار داد.این طرح اگرچه بسیاری از عوامل تهدید کننده روایی داخلی نظیر تاریخچه، بالیدن،آزمون و ابزار سازی را کنترل می کند ولی عامل افت گاه می تواند بر یافته ها تاثیر بگذارد. همچنین به علت عدم استفاده از پیش آزمون،به یکسان بودن گروهها درآغاز اجرای عمل آزمایشی نمی توان کاملا ً مطمئن بود.
طرحواره طرح پیشنهادی پاپهام برای رفع مشکل طرح شماره2
X O2E O1E X1 R E
X O1C O2C X2 R C
گمارش تصادفی محتوی آموزشی آزمون آزمون محتوی آموزش
زمان
طرحواره طرح شماره3
O2E X O1E E
بیانگر غیرهمتا
بودن گروهها
O2C O1C C
پس آزمون پیش آزمون عمل آزمایشی
زمان
طرح شماره4:طرح سریهای زمانی تک گروهی
طرحواره طرح شماره4:
O6 O5 O4 X O3 O2 O1
مشاهدات قبل عمل آزمایشی مشاهدات بعد از
از اجرا اجرا
زمان
طرح شماره 5:طرح سریهای زمانی با گروه کنترل غیرهمتا
O6 O5 O4 X O3 O2 O1 Eگروه آزمایشی
— — — — — — — —
O6 O5 O4 – O3 O2 O1 C گروه کنترل
مشاهدات قبل از اجرا عمل آزمایش مشاهدات بعد از اجرا
طرح شماره6:طرح پیش آزمون-پس آزمون
طرحواره طرح شماره6:
O X O
زمان
پیش آزمون عمل آزمایشی پس آزمون
گروه آزمایشی
طرح شماره7:طرح مقایسه دو گروه غیر همتا با پس آزمون
طرحواره طرح شماره8:
O1E X E گروه آزمایشی
— — — — — — —
O1C Cگروه کنترل
عمل آزمایشی پس آزمون
زمان
طرح شماره 8:طرح مورد پژوهی تک گروهی
طرحواره شماره 8:
O X
عمل آزمایشی پس آزمون
زمان
فصل هشتم
نمونه گیری در ارزشیابی آموزشی
هدفهای کلی
دانشجویان پس از مطالعه مطالب این فصل:
با مفاهیم جامعه و نمونه آشنا می شوند.
روشهای مختلف نمونه گیری را می آموزند
مفهوم و تفاوت گزینش و گمارش تصادفی را یاد می گیرند
به دلایل استفاده و عدم استفاده از روشهای متداول نمونه گیری و روش چند ماتریسی در ارزشیابی پی می برند
چگونگی کاربرد روشهای مختلف نمونه گیری را در موقعیت مناسب یاد می گیرند.
نمونه گیری
به فرایند انتخاب اعضای گروه نمونه از جامعه اصلی،نمونه گیری گفته می شود.نمونه گیری این امکان را فراهم می آورد که نمونه انتخاب شده تا حد ممکن معرف جامعه مورد نظر باشد.
انتخاب نمونه یکی از گامهای مهم در ارزشیابی آموزشی بشمار می آید.نمونه مناسب نمونه ای است که اعضای آن معرف یا نماینده اعضای جامعه ای باشند که از آن انتخاب شده اند.در نمونه گیری تصادفی تمام اعضای جامعه مورد نظر شانس مساوی و یکسان برای انتخاب شدن در گروه نمونه را دارا هستند.هرچه حجم نمونه انتخاب شده بیشتر باشد امکان معرف بودن نمونه بیشتر می شود.
قبل از تصمیم گیری در مورد گزینش یا گمارش تصادفی باید کوچکترین واحد تحلیل در مطالعه مشخص شود.کوچکترین واحد تحلیل در یک مطالعه بر حسب موضوع بررسی می تواند، فرد، کلاس،مدرسه،منطقه،استان یا کشور باشد.
نمونه گیری چند ماتریسی
با استفاده از دو عمل نمونه گیری یعنی نمونه گیری پرسشها و نمونه گیری فراگیران به طور همزمان می توان نسبتا ً کوتاه حداکثر اطلاعات ممکن در زمینه عملکرد آزمودنی ها در پاسخگویی به سوالات تدوین شده را فراهم آورد. استفاده همزمان از دو عمل نمونه گیری را نمونه گیری چند ماتریسی می نامند.
امتیازات نمونه گیری چند ماتریسی:
از طریق ارائه تعداد محدودی پرسش به هر فرد آزمودنی در مجموع می توان در زمانی کوتاه تمام پرسشهای تهیه شده را مورد آزمایش قرار داد و در زمینه عملکردافراد در
هدفهای آموزشی اطلاعات کامل و جامعی کسب نمود.
2. پاسخهای یک گروه نسبتا ً زیاد از آزمودنی ها به چند پرسش محدود را می توان سریعتر و کم هزینه تر از پاسخهای یک گروه نمونه به تعداد زیادی پرسش تصحیح و نمونه گذاری نمود.
3. نمونه گیری از پرسش ها و ارائه چند پرسش به هر فرد آزمودنی،زمان لازم برای شرکت هر فرد در جلسه آزمون را کاهش می دهد.
4. میزان خطای معیار میانگین حاصل از نمونه گیری چند ماتریسی از انحراف معیار حاصل از یک گروه نمونه کوچکتر است.
محدودیتهای نمونه گیری چند ماتریسی
عدم استفاده از این روش برای ارزشیابی آزمودنی ها به صورت انفرادی
فقدان کارایی در آزمونهای شفاهی و آزمونهای سرعت که پاسخگویی به پرسشها مستلزم سرعت عمل بوده و زمان اجرای آزمون در مقایسه با مقدار پرسشهای آزمون کوتاه است.
فصل نهم
تهیه گزارش یافته های ارزشیابی
هدفهای کلی:
دانشجویان پس از مطالعه مطالب این فصل:
نقشهای عامل ارزشیابی و تاثیر آن در تدوین گزارش یافته های ارزشیابی را در می یابند
با تفاوتهای گزارش ارزشیابی تکوینی و ارزشیابی پایانی آشنا می شوند
مراحل تهیه گزارش ارزشیابی را می آموزند
روش تهیه گزارشهای یافته های ارزشیابی را یاد می گیرند.
یافته های ارزشیابی تکوینی را می توان در قالب دو گزارش مختلف عرضه نمود:
گزارش اجرای برنامه
گزارشهای پیشرفت
چهار چوب پیشنهادی برای یک گزارش ارزشیابی
گزارش ارزشیابی را می توان در 6 قسمت به شرح زیر تدوین نمود:
خلاصه یا چکیده
اطلاعات مربوط به زمینه یا موقعیت اجرای برنامه
توصیف مطالعه ارزشیابی
یافته های ارزشیابی
تفسیر یافته ها
نتایج و پیشنهادات
پایان