رگرسيون

کاربرد يک متغير براى عمل پيش‌بينى درخصوص متغير ديگر را رگرسيون مى‌گويند. رگرسيون با کاربرد يک متغير دانسته و مشخص، مقادير متغير غيرمشخص ديگرى را پيش‌بينى مى‌کند؛ (تاجداري، پرويز؛ روش‌هاى علمى تحقيق همراه با نظريهٔ ارزشيابي؛ ص ۳۰۳) مانند تشخيص ميزان تغيير درآمد بر اثر تغيير تحصيلات يا ميزان تغيير توليد کارخانه با ميزان تغيير در ضايعات توليد. ميزان تغيير يک متغير بر اثر متغير ديگر را ضريب رگرسيون نيز مى‌گويند که عبارت است از ميزان تغييرى که در متغير وابسته بر اثر يک واحد تغيير در متغير مستقل بروز مى‌کند. (درآمدى بر تحقيق پيمايشى و تحليل داده‌ها؛ ص ۲۱۴)


رگرسيون بصورت دو متغيره و چند متغيره محاسبه مى‌شود. در رگرسيون دو متغيره، يک متغير مستقل و يک متغير تابع وجود دارد؛ ولى در رگرسيون چند متغيره يک متغير تابع و چند متغير مستقل وجود دارد؛ مثلا‌ً در محاسبهٔ تأثير دو متغير تحصيلات و تجربه شغلى در درآمد، درآمد متغير تابع است و تحصيلات و تجربه شغلى دو متغير مستقل هستند.


خط رگرسيون منعکس‌کننده مسر حرکت کلى نقاط پراکنده در دستگاه مختصات اسمى که مى‌تواند مبين شدت و ضعف و نوع همبستگى بين متغيرها باشد. براى رسم خط رگرسيون بايد از معادله رگرسيون استفاده کرد. در رگرسيون دو متغيره پس از آنکه مسجل شد بين دو متغير همبستگى معنى‌دار وجود دارد، از فرمول زير استفاده مى‌شود:


y = a x + b


در اين فرمول x، مقادير مستقل؛ y، مقادير متغير تابع و وابسته و b، a، ضرايبى هستند که از فرمول‌هاى زير محاسبه مى‌شوند:


      ∑ ( x - x̄ ) ( y - ȳ )  
   ۲۵ =
a =
            ∑ ( x - x̄ ) ۲  


  ȳ - a x b =


وقتى اين مقادير محاسبه شد، مى‌توان به x مقادير مختلف داد و مقدار y را محاسبه کرد و پس از محاسبهٔ مختصات حداقل دو نقطه در دستگاه (يعنى x و y هر يک)، مى‌توان خط رگرسيون را در دستگاه مختصات ترسيم نمود.


آزمون T. آزمون T براى نمونه‌هاى کوچک کاربرد دارد (کمتر از ۳۰ مورد مشاهده)، در سال ۱۹۱۵ بوسيله فردى به‌نام ويليام سيلى گوست (William Seely Gosset) مشاور آمار يکى از مؤسسات ايرلند مطرح شد. (روش‌هاى تحقيق در علوم تربيتى و رفتاري؛ ص ۳۵۳) مفهوم اظهارات او اين بود که انحراف استاندارد در نمونه‌هاى کوچک يا انحراف استاندارد در جامعه شباهت کمى دارد؛ بنابراين، براى حل مسئله آزمون T را پيشنهاد کرد. توزيع T از بسيارى جهات شبيه توزيع با کميّت Z (نمرات استاندارد) است که از فرمول Z = (x-) / σ بدست آيد. به کمک کميّت Z مى‌توان تفاوت موجود در پراکندگى ميان يک سرى انحراف نمره از ميانگين را بوسيله تقسيم انحراف هر نمره از ميانگين (x-) بر انحراف استاندارد آن سرى نمره (σ)، مرتفع نمود و نمره‌‌ها را با يکديگر مقايسه کرد. (آمار استنباطى در علوم انساني؛ ص ۵) البته توزيع T با کميّت Z و منحنى طبيعى تفاوت دارد؛ مثلاً توزيع کميّت Z طبيعى است، درحاليکه توزيع کميّت T تابع تعداد آزمودنى‌هاست که در درجه آزادى (df) تأثير دارد و هرچه درجهٔ آزادى بيشتر باشد شکل توزيع به منحنى توزيع طبيعى نزديکتر است.


از آزمون T براى مقايسه و تشخيص تفاوت و رابطه علّى استفاده مى‌شود و موارد کاربرى آن عبارت است از:


الف - آزمون فرض درباره ميانگين جامعه


ب - آزمون T براى مقايسه ميانگين‌هاى دو گروه مستقل


ج - ازمون T براى گروه‌هاى همبسته. (روش‌هاى تحقيق در علوم تربيتى و روان‌شناسى ص ۴۱۰)


الف - در مورد اول هدف آزمون فرضيهٔ صفر درباره نبود تفاوت بين ميانگين نمونه يا ميانگين جامعه‌اى است که از آن برگزيده شده است. براى اين امر از فرمول


         ( x̄ - ? )  
 
T =
          S    
 
   
  ( N - ۱ )    


استفاده مى‌شودکه در آن x، ميانگين گروه نمونه؛ ، ميانگين جامعه يا عدد ثابت مورد ادعا براى جامعه؛ S، انحراف استاندارد نمونه و N، تعداد افراد نمونه (آزمودنى‌ها) است.


عدد محاسبه شده از طريق فرمول مزبور بايد با جدول توزيع T و با درجهٔ آزادى مربوط و نيز سطح احتمال موردنظر (5% يا ۱% = α) مقايسه شود. براى محاسبه درجهٔ آزادى از فرمول df=N-۱ استفاده مى‌شود. اگر T محاسبه شده از T جدول کمتر باشد فرضيهٔ صفر تأييد مى‌شود.


ب - در مورد دوم هدف مطالعه تأثير متغيرهاى آزمايشى بر دو گروه آزمايش است که بدين وسيله تفاوت تأثير متغيرها سنجيده مى‌شود. براى اين کار از فرمول زير استفاده مى‌شود:


                         ( x۱̄- x۲̄ )               
 
T =
       ۱     ۱        ∑ X۱۲ + ∑ X۲۲    
)
+
( )
(
      N۲     N        ( N۱ + N۲ - ۲ )  


در اين فرمول x۱ ميانگين گروه اول؛ x۲ ميانگين گروه دوم؛ x۲۱∑ مجموع مجذور انحراف از ميانگين نمرات گروه اول؛ x۲۲ ∑ مجموع مجذور انحراف از ميانگين نمرات گروه دوم و N۱ و N۲ فراوانى گروه اول و دوم است.


براى محاسبه درجه آزادى از فرمول( d f = ( N۱ + N۲ - ۲ استفاده مى‌شود.


در پايان عدد محاسبه شده با T جدول در سطح احتمال موردنظر (5% يا ۱% = α) و درجهٔ آزادى مربوطه مقايسه مى‌شود. چنانچه از عدد T جدول بيشتر بود، فرضيه صفر مبنى بر نبود تفاوت رد مى‌شود و فرضيه تحقيق مورد تأييد قرار مى‌گيرد.


ج - در مورد سوم از آزمون T براى مطالعه تأثير يک متغير مستقل در متغير تابع استفاده مى‌شود، درحاليکه متغير تابع در دو زمان يا تحت شرايطى مورد آزمون و اندازه‌گيرى قرار مى‌گيرد تا تأثير متغير مستقل يا رابطه علّى مورد مطالعه قرار گيرد؛ مانند تأثير يک متغير بر يک گروه نمونه و آزمودني، در زمان t۱ و نيز زمان t۲ و سپس مقايسه نتايج آزمون در دو زمان مزبور. براى اين کار از فرمول زير استفاده مى‌شود:


                D ∑  
 
T =
        N ∑ D۲+ ( ∑ D )۲    
)
(
            ( N - ۱ )  


در اين فرمول D∑ ، مجموع تفاضل نمره‌هاى قبل و بعد از اجراى متغير مستقل و D۲∑ مجموع مجذور تفاضل نمره‌هاى قبل و بعد از اجراى متغير مستقل است.


براى محاسبهٔ درجهٔ آزادى نيز از فرمول df=N-۱ استفاده مى‌شود. سپس نتيجه با مقادير جدول T مقايسه مى‌گردد


آزمون F. همانطور که ملاحظه شد، از آزمون T براى مطالعه تفاوت و اثرگذارى در رابطه با دو متغير استفاده مى‌شود، ولى گاهى‌اوقات محقق درصدد تشخيص تفاوت بين اثرگذارى چند متغير يا انتخاب بهترين آنهاست؛ براى مثال، مى‌خواهد بداند که بين چند روش تدريس مثلاً فارسى يا در بين چند روش توليد کالا با چند روش مديريت يا چند روش کاشت محصول، کدام روش بهتر است.


براى اين کار، استفاده از آزمون T بصورت مقايسه‌هاى زوجى امکان‌پذير است، ولى بروز اشتباهات آمارى و محاسبات غلط عملاً بهره‌بردارى از اين روش را غيرممکن مى‌سازد؛ از اين‌رو، از روش آزمون ديگرى به نام آزمون( F (F test با روش تحليل واريانس استفاده مى‌شود. اين روش به محقق در تشخيص تفاوت‌هاى معنى‌دار بين گروه‌ها و تأثير متغيرها در آنها کمک مى‌نمايد. از آنجا که بيان اين آزمون نياز به تفصيل و اطالهٔ کلام دارد، از توضيح آن در اينجا خوددارى مى‌شود و علاقه‌مندان مى‌توانند به کتب آمار مراجعه نمايند. (آمار استنباطى در علوم انساني؛ و روش‌هاى علمى تحقيق همراه با نظريه ارزشيابى.)