ويژگى‌هاى تقويتى بازخورد

در يک مسابقه فرض کنيد مربى فرياد مى‌زند ”آفرين“، اين تشويق زمانى انجام شده که بازيکن بسکتبال، پاس جسورانه‌اى داد. اين پديده دومين اثر مهم بازخورد را که اثر تقويتى آن است، نشان مى‌دهد. بازخوردى که پس از يک عمل داده مى‌شود، احتمال تکرار آن عمل را در شرايطى مشابه افزايش مى‌دهد.


روانشناسان در آزمايشگاه، يادگيرى وسيله‌اى (Instrumental learning) را بررسى کردند. در يکى از اين آزمايش‌ها، اگر حيوان آزمايشگاهى گرسنه ۵ ثانيه پس از شنيدن صدا اهرمى را مى‌فشرد، به‌عنوان پاداش به او غذا مى‌دادند. اين حيوان به‌تدريج آموخت که با اطمينان بسيار، اهرم را در زمان مقرر فشار دهد. سگ‌هاى خانگى که پس از اطاعت از فرمان، با يک خوراکى يا يک نوازش ساده تشويق مى‌شوند، اطاعت کردن را مى‌آموزند.


گاهى اوقات يک محرک تنبيهى (Punishing stimulus)، مانند شوک الکتريکى ارائه مى‌شود. در اين شرايط حيوان مى‌آموزد از عملى که به تنبيه منجر مى‌شود، پرهيز کند. اسبى که من در زمان کودکى داشتم، در مدت ۲ دقيقه آموخته بود که حصار الکتريکى را لمس نکند (که به وى يک شوک ضعيف ولى نامطبوع مى‌داد) و به‌ويژه براى اين کار از بينى نرم خود استفاده نکند.


دانشمندان پيشتر از اين دريافته بودند که ماهيت و زمان بازخورد، اثر زيادى بر يادگيرى پاسخ هدف دارد. اين يافته‌ها را ثورندايک (Thorndike) در ۱۹۲۷ در ”قانون تجربى اثر - Empirical law of effect“ خود جمع‌آورى و خلاصه کرده که اساساً به‌شرح زير است:


قانون اثر. عملى که به‌وسيلهٔ محرکى فراخوانى شود و با پى‌آمدى مطبوع يا پاداش دنبال شود، با ظهور دوبارهٔ محرک، ميل به تکرار آن خواهد بود؛ عملى که با پى‌آمدى نامطبوع يا با تنبيه دنبال شود، ميل به عدم تکرار آن است.


در اين ديدگاه، تمرکز بر بازخوردهاى تقويت‌کننده است. هنگامى که تقويت احتمال بروز پاسخ آتى را افزايش دهد، مثبت ناميده مى‌شود مانند زمانى که دادن بيسکويت موجب افزايش اطاعت سگ خانگى مى‌شود. تقويت، زمانى منفى است که اين احتمال را کاهش دهد، مانند اثر شوک در تماس با حصار الکتريکي. از اين رو، يادگيرى وسيله‌اي، استحکام (به‌وسيلهٔ تقويت منفي) رابطهٔ محرک و پاسخ غلط مى‌باشد. زمانى که محرک مجدداً ارائه شود، پاسخ صحيح منجر به توليد مجدد و پاسخ غلط منجر به بازدارى مى‌گردد و به‌طور کلى به اجراء مؤثرتر منجر مى‌شود. اين احتمال که بازيکن بسکتبال مذکور در ابتداى بحث، به‌دليل تقويت مثبت مربى اين‌گونه پاس را در آينده بيشتر انجام دهد، بسيار زياد است.


در سومين مثالى که پيش از اين ذکر شد، مربى به دوندهٔ خوب خود مى‌گويد که به‌دليل نمرات درسى پائين، از مسابقه کنار گذاشته شده است. اين نمونه‌اى از تقويت منفى است. بازخورد (کنار گذاشتن) بايد به کاهش رفتارى که در آينده به آن بازخورد منجر مى‌شود (درس نخواندن) بينجامد. اين پديده به‌ نوبهٔ خو د احتمال کسب نمرات پائين را کم مى‌کند.


تقويت و رفتار گزينه‌اي. قانون اثر ثورندايک تأثير عمده‌اى بر تحقيق و تفکر در تعليم و تربيت و تمرين مهارت دارد. يادگيرى مهارت شکلى از يادگيرى وسيله‌اى شناخته شده است؛ زيرا نوعاً فراگيرنده بايد در جواب محرک، پاسخ صحيحى بدهد (يک حرکت ماهرانه) و از پاسخ غلط پرهيز کند. به‌نظر مى‌رسد که بازخورد، مانند آگاهى از نتيجهٔ نوع تقويت است و پيوستگى بين محرک و حرکات را استحکام مى‌بخشد يا تضعيف مى‌کند. تقويت، همان‌گونه که در شکل زير خلاصه شده است، در اکثر ورزش‌ها و بازى‌هائى که در اينجا مورد توجه هستند، جنبه‌اى از رفتار گزينه‌اى (Choice behavior) است. انتخاب پرتاب توپ بيسبال به اولين پايگاه به جاى دومين، گرفتن پاس توپ فوتبال يا دفاع در برابر يک مهاجم بسکتبال، نمونه‌هائى از اين بازى‌ها و ورزش‌ها است. تقويت اثر شديدى بر تلاش دارد؛ براى مثال وقتى مربى تلاش فوق‌العادهٔ شاگرد خود را درک و آن را تقويت ‌کند، چنين تلاشى افزايش مى‌يابد. روشن است که تقويت گزينش‌هاى شاگرد توسط مربي، اثر پر قدرتى بر الگوى گزينش‌هاى آينده دارد.


تسهیل یا بازداری گزینه‌ها بر مبنای بازخورد در بارهٔ پیامد آنها . در این موقعیت

محرک ، پس از چند بار کوشش ، عمل 2 بوضوح بر عمل 1 غالب می‌شود
تسهیل یا بازداری گزینه‌ها بر مبنای بازخورد در بارهٔ پیامد آنها . در این موقعیت محرک ، پس از چند بار کوشش ، عمل 2 بوضوح بر عمل 1 غالب می‌شود

تقويت ناپياپي. يکى از اصول مهم يادگيرى وسيله‌اي، تقويت ناپياپى (Intemittent reinforcement) است که در آن بازخورد فقط در هنگام لزوم ارائه مى‌شود و براى يادگيرى مؤثرتر از زمانى است که بازخورد در هر کوشش داده مى‌شود. در تحقيقات افزايش يادگيرى را معمولاً براساس عملکرد در يک آزمون خاموش‌سازى (Exinction test) تخمين مى‌زنند. آزمون خاموش‌سازي، آزمونى است که در آن رفتار را پس از حذف تمام تقويت‌ها ارزشيابى مى‌کنند. در اين آزمون آزمودنى‌هائى که تقويت ناپياپى دريافت کرده‌اند، زمان بيشترى به پاسخ دادن ادامه مى‌دهند. اين زمان به شکل معنى‌دارى بيشتر از زمان پاسخ آزمودنى‌هائى است که در هر کوشش، تقويت شده‌اند. کاهش تدريجى مقدار و تواتر تقويت در تمرين، به موازات يادگيرى رفتار مناسب، معمولاً باعث استحکام اجراء هنگام حذف کامل تقويت خواهد شد. اين اصول، کاربردهاى قابل توجهى در يادگيرى حرکتى انسان دارد - به‌ويژه در يادگيرى گزينه‌ها که در آن مربى يا معلم در طول تمرين، تقويت را فراهم مى‌کند، اما هدف نهائى در اجراء صحيح آزمون (بازى يا مسابقه) است که تقويت به‌طور کامل در آن حذف مى‌شود. در اينکه اصول تقويت در بسيارى از جنبه‌هاى يادگيرى حرکتي، به‌ويژه در يادگيرى برگزيدن کاربرد داشته باشد، اندکى شک وجود دارد.