برنامه‌های تقویت

در زندگی روزمره، به‌ندرت هر رفتار معینی در کلیه موارد ابرازشدن با تقویت روبه‌رو می‌شود. مثلاً سخت‌کوشی ”گاهی“ ستایش به‌دنبال دارد، اما در اغلب موارد هم کسی به آن توجهی نمی‌کند. اگر شرطی‌سازی رفتار عامل فقط با تقویت پیوسته (continuous reinforcement) ممکن می‌شد، این نوع شرطی‌سازی نقشی محدود در زندگی ما ایفاء می‌کرد. اما واقعیت این است که به‌محض به‌وجود آمدن هر رفتار خاصی می‌توان با تقویت گهگاهی آن را حفظ کرد. این پدیده، تقویت پاره‌ای (partial) نامیده می‌شود و می‌توان آن را در آزمایشگاه با کبوتری که سرگرم یادگیری دریافت غذا در برابر نک‌زدن به تکمه است، نمایش داد.


همین‌که این رفتار عامل تثبیت شد، اگرچه کبوتر فقط گهگاه تقویت دریافت دارد، باز هم با آهنگ تند به تکمه نک می‌زند. در برخی موارد، کبوترانی که به‌طور متوسط هر ۵ دقیقه یک‌بار (۱۲ بار در ساعت) پاداش دریافت می‌داشتند، تا ۶۰۰۰ بار در ساعت هم به تکمه نک زده‌اند! به‌علاوه، رفتاری که با تقویت پاره‌ای نگهداری شده، بسیار کندتر از رفتاری که با تقویت پیوسته نگهداری‌شده، خاموش می‌شود. این پدیده به‌اثر تقویت پاره‌ای (partial reinforcement effect) معروف است. احساس شهودی ما هم مؤید چنین پدیده‌ای است، زیرا وقتی در دورهٔ نگهداری رفتار، تقویت از نوع پاره‌ای باشد، بین برنامهٔ خاموشی و برنامه‌ٔ نگهداری رفتار تفاوت کمتری وجود خواهد داشت.


وقتی تقویت فقط برخی از اوقات روی دهد، باید بدانیم ارائهٔ آن دقیقاً چگونه برنامه‌ریزی شده است - مثلاً پس از هر سه پاسخ، یا مثلاً پس از هر پنج ثانیه. در واقع، برنامهٔ تقویت، الگوی پاسخ‌دهی را تعیین می‌کند. بعضی از برنامه‌ها، برنامهٔ نسبتی (ratio schedule) نامیده می‌شوند زیرا در آنها تقویت، به‌تعداد پاسخ‌های جاندار بستگی دارد - شبیه وضع کارگر کارخانه که برحسب تعداد قطعات ساخته‌شده یا مقدار کار انجام‌شده مزد دریافت می‌دارد. نسبت پاسخ‌ها می‌تواند ثابت یا متغیر باشد. در برنامهٔ نسبتی ثابت (fixed ration schedule) (که برنامه FR نامیده می‌شود)، تعداد پاسخ‌های لازم ثابت است. اگر ۵ پاسخ موردنظر باشد (FR5)، در آن صورت ۵ بار پاسخ برای دریافت هر تقویت ضرور است، اگر تعداد ۵۰ پاسخ موردنظر باشد (FR50)، پنجاه بار پاسخ لازم است، و برهمین قیاس. به‌طور کلی، هرچه مقدار این نسبت بزرگتر باشد، میزان پاسخ جاندار بیشتر است، به‌ویژه وقتی که جاندار در ابتدا با نسبت تقریباً پائینی مثلاً FR5، آموزش دیده باشد و به‌تدریج آموزش با نسبت‌های بزرگتر ادامه یافته، در نهایت مثلاً به FR100 رسیده باشد. مثل این می‌ماند که کارگری فرضی، در ابتدا ۲۰۰۰ تومان به ازاء حاشیه‌دوزی هر ۵ دست لباس دریافت دارد ولی بعد کار کساد شود و مجبور شود در مقابل همان مبلغ، ۳۰ دست لباس حاشیه‌دوزی کند. اما شاید بارزترین جنبهٔ رفتار در برنامهٔ تقویت نسبی این باشد که درست پس از هر تقویت، مکثی در پاسخ‌دهی روی می‌دهد (به سمت چپ شکل الگوی عمومی پاسخ در چهار برنامهٔ اصلی تقویت نگاه کنید). در مثال فوق، برای کارگر فرضی ما مشکل است که پس از هر مقدار حاشیه‌دوزی که به دریافت تقویت می‌انجامد، بلافاصله دوباره به حاشیه‌دوزی بپردازد.


الگوی عمومی پاسخ در چهار برنامهٔ اصلی تقویت.
الگوی عمومی پاسخ در چهار برنامهٔ اصلی تقویت.

هر منحنی، نمودار تعداد تراکمی پاسخ‌های حیوان برحسب زمان است، و بنابراین، شیب منحنی، آهنگ پاسخ حیوان را نشان می‌دهد. منحنی‌های سمت چپ مربوط به برنامه‌های نسبتی هستند. در منحنی برنامهٔ FR، به‌بخش‌های افقی توجه کنید که مکث‌ها را نشان می‌دهند (حاکی از ثابت‌ماندن تعداد تراکمی پاسخ‌ها). منحنی‌های سمت راست مربوط به برنامه‌های زمانی هستند. در منحنی زمانی FI نیز بخش‌های افقی نشان‌دهندهٔ مکث‌ها هستند (برگرفته از شوارتز، ۱۹۸۹).


با برنامهٔ نسبتی متغیر (variable ratio schedule) (برنامهٔ VR) نیز آزمودنی به‌طور متوسط پس از چند پاسخ معین، تقویت دریافت می‌دارد ولی تعداد پاسخ‌های لازم به‌نحو غیرقابل پیش‌بینی متغیر است. مثلاً در برنامهٔ VR5، تعداد پاسخ لازم برای دریافت تقویت ممکن است گاهی ۱، زمانی ۱۰، و به‌طور متوسط ۵ پاسخ باشد. در برنامهٔ VR برخلاف برنامهٔ FR، مکثی در رفتار جاندار دیده نمی‌شود (به‌سمت چپ شکل الگوی عمومی پاسخ در چهار برنامهٔ اصلی تقویت نگاه کنید)، شاید به این سبب که جاندار به‌هیچ‌وجه نمی‌تواند تشخیص دهد که چه وقت به تقویت می‌رسد. مثال گویای برنامهٔ VR در خارج از آزمایشگاه، طرز کار با ماشین جک‌پات (slot machine) است. در این ماشین، تعداد پاسخ‌های لازم (دفعات بازی لازم) برای دریافت تقویت (برنده‌شدن) دائماً تغییر می‌کند و بازیکن به‌هیچ‌وجه نمی‌تواند پیش‌بینی کند که کی تقویت دریافت خواهد کرد. برنامه‌های VR به پاسخ‌دهی بسیار زیاد می‌انجامند (نکته‌ای که احتمالاً مؤسسات بخت‌آزمائی نیز از آن آگاه هستند).


برنامه‌های دیگری هم هستند که برنامه‌های زمانی (interval schedules) نامیده می‌شوند زیرا در این برنامه‌ها تقویت فقط پس از گذشت مدت زمان معین ارائه می‌شود. در اینجا نیز برنامه ممکن است ثابت یا متغیر باشد. در برنامهٔ زمانی ثابت (fixed interval schedule) (FI)، جاندار پس از گذشت مدت زمان معین از تقویت قبلی، در برابر اولین پاسخش تقویت دریافت می‌دارد، مثلاً در برنامهٔ FI2 (برنامهٔ زمانی ثابت دو دقیقه‌ای)، تقویت فقط وقتی ارائه می‌شود که دو دقیقه از پاسخ تقویت‌شدهٔ قبلی گذشته باشد. پاسخ‌هائی که طی این دو دقیقه داده می‌شود هیچ پیامدی ندارند. از ویژگی‌های برجستهٔ پاسخ‌دهی در برنامهٔ FI، مکثی است که بلافاصله پس از تقویت روی می‌دهد. (این مکث پس از تقویت، حتی ممکن است طولانی‌تر از مکثی باشد که پس از تقویت در برنامهٔ FR روی می‌دهد.) از دیگر ویژگی‌های بارز پاسخ‌دهی در برنامهٔ FI این است که با نزدیک‌شدن پایان فاصلهٔ زمانی، آهنگ پاسخ‌دهی جاندار تندتر می‌شود (به‌سمت راست شکل الگوی عمومی پاسخ در چهار برنامهٔ اصلی تقویت نگاه کنید). مثال خوبی از برنامهٔ FI در زندگی روزمره، دریافت بسته‌های پستی است که روزی یک‌بار (FI24 ساعته)، یا در برخی جاها روزی دوبار (FI12 ساعته)، صورت می‌گیرد. هربار پس از دریافت محمولهٔ پستی خود، ما بلافاصله دوباره به صندوق پستی سر نمی‌زنیم (دورهٔ مکث)، اما به‌تدریج که موقع دریافت بسته‌های پستی نزدیکتر می‌شود دوباره به صندوق پستی سر می‌زنیم.


در برنامهٔ زمانی متغیر (variable interval schedule) (برنامهٔ VI)، باز هم تقویت وابسته به سپری‌شدن فاصلهٔ زمانی معین است ولی این فاصلهٔ زمانی به‌طرزی غیرقابل پیش‌بینی تغییر می‌کند. مثلاً در برنامهٔ VI10 (برنامهٔ فاصله‌ای متغیر ۱۰ دقیقه‌ای) گاهی این فاصلهٔ مبنا ممکن است ۲ دقیقه باشد و برخی اوقات ۲۰ دقیقه، ولی در هر حال میانگین فاصله‌های زمانی ۱۰ دقیقه است. برعکس تغییرات پاسخ‌دهی در برنامه FI، جاندار در برنامهٔ VI به‌نحوی مستمر با آهنگی تند پاسخ می‌دهد (به‌سمت راست شکل الگوی عمومی پاسخ در چهار برنامهٔ اصلی تقویت نگاه کنید). به‌عنوان مثالی از برنامهٔ VI در زندگی روزمره، گرفتن شمارهٔ تلفنی را که معمولاً اشغال است درنظر بگیرید. برای گرفتن این شماره، مجبور هستید مرتباً مدتی صبر کنید بعد دوباره آن را بگیرید و البته طول این مدت غیرقابل پیش‌بینی است.