بررسی شرطی‌سازی عامل در پایان قرن گذشته با سلسله آزمایش‌های ای.ال ترندایک (E.L.Thorndike) شروع شد (۱۸۹۸). ترندایک که بسیار تحت تأثیر نظریهٔ تکاملی داروین بود، می‌کوشید نشان دهد که بین یادگیری انسان و یادگیری حیوان‌ها تداوم و پیوستگی وجود دارد. آزمایش‌های ترندایک معمولاً به‌ترتیبی که در زیر شرح می‌دهیم انجام می‌شد: گربه‌ای گرسنه در قفسی گذاشته می‌شود که در آن با چفتی ساده بسته شده است و همزمان با آن، تکه‌ای ماهی در بیرون کنار قفس قرار داده می‌شود. ابتدا گربه سعی می‌کند با درازکردن دستش از بین میله‌ها به غذا دست یابد. وقتی این کار بی‌نتیجه می‌ماند در قفس به این طرف و آن‌طرف می‌رود و به رفتارهای بسیار مختلف می‌پردازد. اما دیر یا زود، ناخواسته به چفت در قفس می‌خورد و از قفس آزاد می‌شود، و به‌ماهی دست می‌یابد. بعد، پژوهشگر دوباره گربه را به قفس برمی‌گرداند و تکهٔ ماهی دیگری بیرون قفس می‌گذارد. گربه دوباره کم و بیش همان رفتارهای قبلی را تکرار می‌کند تا اینکه بار دیگر تصادفاً به چفت می‌خورد. این ماجرا بارها و بارها تکرار می‌شود. گربه، طی کوشش‌های متوالی، بسیاری از رفتارهای نامربوط را کنار می‌گذارد و در نهایت همین‌که در قفس گذاشته شود به‌راحتی چفت را باز می‌کند و آزاد می‌شود. می‌بینیم گربه یاد گرفته است برای به‌دست آوردن غذا چفت در را باز کند.


بی.اف.اسکینر
بی.اف.اسکینر

به‌نظر می‌آید که گربه ”هوشمندانه“ عمل می‌کند، اما ترندایک معتقد بود که اینجا ”هوش“ به‌هیچ‌وجه مطرح نیست. در هیچ‌ لحظه‌ای به‌نظر نمی‌رسد که گربه به بصیرتی در مورد حل مسئله دست یافته باشد، بلکه عملکرد گربه به‌تدریج طی کوشش‌های بیشتر، بهبود می‌یابد. به‌جای بصیرت یافتن، به‌نظر می‌رسد گربه به رفتار کوشش و خطا می‌پردازد و وقتی پاداشی بلافاصله به‌دنبال یکی از آن رفتارها بیاید، یادگیری آن عمل نیرومندتر می‌شود. ترندایک این نیرومندترشدن را قانون اثر (law of effect) نامید. استدلالش این بود که در یادگیری رفتار، بنا به قانون اثر، از میان یک سلسله رفتارهای اتفاقی فقط رفتارهائی برگزیده می‌شوند که پی‌آمد مثبت داشته باشند. این فرآیند شبیه فرآیند تکامل است که در آن طبق قانون بقاء انسب (survival of the fittest)، از میان تفاوت‌های اتفاقی میان افراد هر نوع جاندار معین، فقط تغییراتی ماندگار می‌شوند که موجب بقاء آن نوع شوند. بنابراین، قانون اثر ضامن بقاء مناسب‌ترین پاسخ‌ها است.

آزمایش‌های اسکینر

بی‌.اف. اسکینر (B.F.Skinner) موجب دگرگونی‌هائی در تفکر پژوهشگران و نحوهٔ بررسی شرطی‌سازی عامل شد. روش او برای بررسی شرطی‌سازی رفتار عامل از روش ترندایک ساده‌تر است - زیرا متمرکز بر رفتار معینی است - و با اقبال فراوان نیز روبه‌رو شده است.


در آزمایش اسکینر، حیوانی گرسنه (معمولاً موش صحرائی یا کبوتر) در قفسی شبیه به آنچه در شکل دستگاه شرطی‌سازی عامل نشان داده شده، قرار می‌گیرد. این قفس به جعبهٔ اسکینر شهرت یافته است. داخل قفس فقط میله‌‌ای از دیوارهٔ قفس بیرون زده، ظرف غذائی زیر این میله قرار دارد، و چراغ کوچکی بالای میله هست که روشن کردن آن در اختیار آزمایشگر است. وقتی موش در این قفس به‌حال خود رها می‌شود، این‌طرف و آن‌طرف پرسه می‌زند و قفس را وارسی می‌کند؛ هر از گاهی میله را از نظر می‌گذراند و آن را به‌طرف پائین فشار می‌دهد. تعداد دفعاتی که در آغاز در مدت زمان معینی موش میله را به پائین فشار می‌دهد، سطح خط پایه (baseline level) نامیده می‌شود. پس از تعیین سطح خط پایه، آزمایشگر مخزن غذای خارج از قفس را به‌کار می‌اندازد. حال، هربار که موش میله را به پائین فشار دهد یک حبهٔ کوچک غذا به‌داخل ظرف رها می‌شود. موش حبهٔ غذا را می‌خورد و فوراً دوباره میله را فشار می‌دهد. غذا، پائین فشردن میله را تقویت می‌کند و میزان این کار به‌طور چشمگیر افزایش می‌یابد. اگر مخزن غذا از کار انداخته شود و پائین فشردن میله، دیگر موجب دریافت غذا نشود، از میزان این عمل کاسته می‌شود. به‌این ترتیب، پاسخی که به‌روش عاملی شرطی شده است (پاسخ عامل) همانند پاسخ شرطی‌شده به‌روش کلاسیک، درنتیجهٔ عدم تقویت به‌تدریج خاموش می‌شود (extinction). آزمایشگر می‌تواند نوعی آزمون افتراق (discrimination) ترتیب دهد، به این‌صورت که فقط در مواردی غذا ارائه کند که موش میله را به‌هنگام روشن بودن چراغ به پائین فشار دهد. در اینجا موش از طریق تقویت انتخابی (Selective reinforcement) شرطی می‌شود. در این مثال، چراغ محرک افتراقی است که پاسخ را کنترل می‌کند.


دستگاه شرطی‌سازی عامل. عکسی از قفس اسکینر که در آن مخزن ارائهٔ حبه‌های غذا نیز دیده می‌شود. از کامپیوتر برای کنترل آزمایش و ثبت پاسخ‌های موش استفاده می‌شود.
دستگاه شرطی‌سازی عامل. عکسی از قفس اسکینر که در آن مخزن ارائهٔ حبه‌های غذا نیز دیده می‌شود. از کامپیوتر برای کنترل آزمایش و ثبت پاسخ‌های موش استفاده می‌شود.

بنابراین، در شرطی‌سازی عامل، با تقویت‌کننده‌ای (اغلب چیزی مانند غذا یا آب) که در پی پاسخ می‌آید بر احتمال رویداد پاسخ افزوده می‌شود. چون میله همیشه در قفس اسکینر هست، موش می‌تواند به دفعات کم یا زیاد آن را به پائین فشار دهد. بنابراین، نرخ پاسخ جاندار شاخص خوبی از نیرومندی رفتار عامل است. هرچه پاسخ در مدت زمانی معین به دفعات بیشتر روی دهد، نیرومندی آن پاسخ بیشتر است.

تلویحات شرطی‌سازی عامل در زمینهٔ پرورش کودک

هرچند موش و کبوتر در شرطی‌سازی عامل، آزمودنی‌های مرجح بوده‌اند، این نوع شرطی‌سازی را می‌توان در مورد بسیاری از جانداران، از جمله انسان، به‌کار برد. در واقع، شرطی‌سازی عامل، تلویحات بسیار در زمینهٔ پرورش کودک دارد، که نمونهٔ روشن آن را در مورد زیر می‌بینیم: کودک خردسالی، هر وقت به‌ویژه موقع خواب، پدر و مادرش به او کم‌توجهی می‌کردند، قشقرق راه می‌انداخت. چون در این موارد بالاخره کودک موفق به جلب‌توجه پدر و مادر می‌شد، احتمالاً همین توجه آنها قشقرق راه انداختن او را تقویت می‌کرد. برای از بین بردن این رفتار، به پدر و مادر پیشنهاد شد شب‌ها هنگام خواب برنامهٔ معمولی خود را دنبال کنند، اما داد و فریاد کودک را ولو رنج‌آور هم باشد نادیده بگیرند. با خودداری از ارائهٔ تقویت‌کننده (توجه)، می‌بایستی قشقرق‌ راه‌‌انداختن خاموش شود، که دقیقاً همین‌طور هم شد. طی فقط ۷ روز، مدت زمان گریه و زاری کودک به‌هنگام خواب از ۴۵ دقیقه به‌صفر کاهش یافت (ویلیامز - Williams در ۱۹۵۹).


در کاربرد دیگر شرطی‌سازی عامل در پرورش کودک، به رابطهٔ زمانی بین پاسخ و تقویت آن توجه می‌شود. آزمایش‌های آزمایشگاهی نشان داده‌اند که تقویت (فوری) از تقویت معوق مؤثرتر است. هرقدر فاصلهٔ زمانی بین پاسخ عامل و تقویت طولانی‌تر باشد، نیرومندی پاسخ کمتر خواهد بود. بسیاری از روانشناسان رشد یادآور شده‌اند که در مورد کودکان خردسال به‌تعویق‌ افتادن تقویت نقش مهمی دارد. اگر کودک با مهربانی با حیوانی دست‌آموز رفتار کند، بهترین راه نیرومندتر کردن این رفتار آن است که کودک را بلافاصله تحسین کنیم (بلافاصله به او پاداش دهیم)، نه آنکه با تأخیر عمل کنیم. به‌همین ترتیب، اگر کودک بدون دلیل کسی را کتک بزند، برای از بین بردن این رفتار پرخاشگرانه بهتر است او را بلافاصله تنبیه کنیم نه آنکه مدتی بعد.