تجارب گذشته را به پیش بینی حوادث آینده بدل سازد. یکی از روش های آماری که این گونه داده ها را مورد استفاده قرار می دهد رگرسیون نامیده می شود. رگرسیون یکی از مدل هایی است که توصیفی از رفتار تاریخی و جاری متغیر(ها) به دست داده و با این فرض که روند گذشته و حال، مبنای قابل اتکایی برای پیش بینی آینده است جهت تخمین حرکت آتی متغیر(های) مورد نظر بکار می رود. در ادامه، مفاهیم و آزمون های آماری مورد استفاده در این تحقیق را بصورت خلاصه بیان می کنیم.

3-8-1- همبستگی43
تحلیل همبستگی ابزاری آماری برای تعییین نوع و درجه رابطه یک متغیر کمی با متغیر کمی دیگر است. ضریب همبستگی یکی از معیارهای مورد استفاده در تعیین همبستگی دو متغیر می باشد. ضریب همبستگی شدت رابطه و همچنین نوع رابطه (مستقیم یا معکوس) را نشان می دهد. این ضریب بین 1 تا 1- است و در صورت عدم وجود رابطه بین دو متغیر، برابر با صفر می باشد (مومنی، 1386).
ضریب همبستگی پیرسون به صورت زیر محاسبه می شود:

این ضریب همبستگی، روشی پارامتری است و برای داده هایی با توزیع نرمال یا تعداد زیاد داده ها استفاده می شود (مومنی، 1386).

3-8-2- مفهوم معنی داری در همبستگی
معنی داری44 که به اختصار آن را با «sig» نشان می دهیم، میزان خطایی است که در رد فرضیه صفر () مرتکب می شویم. sig به p-value نیز معروف است. هر چه مقدار sig کمتر باشد رد فرضیه صفر () ساده تر می شود. آلفا () سطح خطایی است که محقق در نظر می گیرد (که معمولا 5 درصد است). به طور کلی می توان گفت:
sig
sig
مفهوم معنی داری در همبستگی اینست که آیا همبستگی بدست آمده بین دو متغیر را می توان شانسی و تصادفی دانست یا اینکه واقعا نشان می دهد بین دو متغیر همبستگی وجود دارد. این موضوع که عدد بدست آمده معنی دار است یا نه از خود عدد بدست آمده با اهمیت تر است. معنی داری همبستگی به شدت تحت تاثیر حجم نمونه است.
اگر sig (سطح اهمیت بدست آمده) کمتر از 5 درصد (سطح اهمیت مورد نظر که در این تحقیق برابر با 5 درصد در نظر گرفته شده است) باشد فرض رد می شود و فرض تایید می شود و این به این معنی است که بین این دو متغیر همبستگی وجود دارد در غیر اینصورت فرض را نمی توان رد کرد و فرض وجود همبستگی بین دو متغیر مورد قبول واقع نمی شود (مومنی، 1386).
3-8-3- ضریب تعیین
با به توان دو رساندن مقدار ضریب همبستگی ، مقدار ضریب تعیین بین دو متغیر بدست می آید. ضریب تعیین نشان می دهد که چند درصد تغییرات متغیر وابسته توسط متغیر مستقل تبیین می شود. در رگرسیون، از این ضریب استفاده زیادی می شود (مومنی، 1386).

3-8-4- خطای معیار تخمین
این شاخص میزان پراکندگی نقاط حول خط رگرسیون (در فضای دو بعدی) را اندازه گیری می کند. هر چه مقدار این شاخص بیشتر باشد پراکندگی نقاط حول خط رگرسیون بیشتر خواهد بود. واحد اندازه گیری این شاخص همان واحد اندازه گیری متغیر وابسته است (مومنی، 1386).
این شاخص بصورت زیر محاسبه می شود:

مقدار برآورد شده، تعداد مشاهدات، تعداد متغیرهای مستقل.

3-8-5- رگرسیون چندگانه
واژه رگرسیون45 به معنای بازگشت است و نشان دهنده آن است که مقدار یک متغیر به متغیر دیگری بر می گردد. اساسی ترین فرض در تحلیل رگرسیون عباتست از: عواملی که چگونگی یک فعالیت یا رفتار اقتصادی را در گذشته و حال تحت تاثیر قرار داده اند در آینده نیز کم و بیش به همان میزان، به اثربخشی خود ادامه خواهند داد (آذر، 1380).
مدل رگرسیون چند متغیره (چند گانه) شامل دو یا چند متغیر مستقل است که متغیر وابسته تحت تاثیر این متغیرهای مستقل قرار می گیرد. در این مدل آماری، فرض بر این است که رابطه بین متغیرهای مستقل و متغیر وابسته به صورت زیر می باشد:
،
که در آن پارامترهای مجهول، متغیری تصادفی و ثابت های معلوم هستند (آذر و مومنی، 1385).
شیوه کار رگرسیون به این صورت است که ابتدا باید معنی داری کل مدل رگرسیون مورد آزمون قرار گیرد که این کار توسط جدول ANOVA (تحلیل واریانس) صورت می گیرد. سپس باید معنی داری تک تک ضرایب متغیرهای مستقل بررسی شود که این کار با استفاده از جدول ضرایب صورت می گیرد (مومنی، 1386).

3-8-6- تحلیل واریانس (آزمون F )
آزمون F ، معناردار بودن را به لحاظ آماری بررسی می کند. با این آزمون، اعتبار آماری مدل رگرسیون تایید می گردد. فرمول ها و روابط آزمون F را در جدول 3-1 مشاهده می نمایید:
جدول 3-1- تحلیل واریانس رگرسیون برآوردی
سطح معنی داری
آماره F
میانگین
توان های دوم
درجه آزادی
مجموع توان های دوم
منبع تغییرات

K

رگرسیون

1 – k – n

باقیمانده



1 – n

مجموع

اگر سطح معنی داری بدست آمده کمتر از سطح خطای مورد نظر (5 درصد) باشد فرض رد شده و فرض تایید می شود، یعنی اعتبار کل مدل تایید می گردد.
3-8-7- مفروضات رگرسیون خطی
در صورتی محقق می تواند از رگرسیون خطی استفاده نماید که شرایط زیر محقق شده باشند (مومنی، 1386):
میانگین (امید ریاضی) خطاها صفر باشد. به عبارت دیگر
واریانس خطاها ثابت باشد. به عبارت دیگر
مفروضات 1و2 بدین معنی است که خطاها باید دارای توزیع نرمال باشد.
بین خطاهای مدل همبستگی وجود نداشته باشد. به عبارت دیگر
متغیر وابسته دارای توزیع نرمال باشد.
بین متغیرهای مستقل همبستگی وجود نداشته باشد (دارای هم خطی نباشند)
در ادامه به روش هایی اشاره می شود که این مفروضات را مورد ارزیابی قرار می دهند.

3-8-8- نمودار توزیع خطاها (بررسی نرمال بودن توزیع خطاها)
یکی از مفروضات در نظر گرفته شده در رگرسیون آن است که خطاها دارای توزیع نرمال با میانگین صفر می باشند. بدیهی است در صورت عدم برقراری این پیش گزیده، نمی توان از رگرسیون استفاده کرد. بدین منظور باید مقادیر استاندارد خطاها محاسبه شود و نمودار توزیع داده ها و نمودار نرمال آن ها رسم شود و سپس مقایسه ای بین دو نمودار صورت گیرد (مومنی، 1386).

3-8-9- نمودار واریانس خطا ها (بررسی ثابت بودن واریانس خطاها)
با استفاده از نموداری که محور افقی آن را مقادیر استاندارد متغیر وابسته و محور عمودی آن را مقادیر استاندارد خطاها تشکل داده باشند، می توان در مورد واریانس خطاها قضاوت نمود. در صورتیکه نمودار پراکندگی نقاط رسم شده بصورت یک رابطه غیر خطی نباشد می تواند بیانگر ثابت بودن واریانس خطاها باشد (زرگر، 1384).
3-8-10- آزمون دوربین- واتسون46
به منظور بررسی استقلال خطاها از یکدیگر (تفاوت بین مقادیر واقعی و مقادیر پیش بینی شده توسط معادله رگرسیون) از آزمون دوربین- واتسون استفاده می شود که آماره آن بصورت زیر محاسبه می شود:

میزان اختلال یا خطا در دوره زمانی
میزان اختلال یا خطا در دوره زمانی قبل
اگر همبستگی بین خطاها را با نشان دهیم در این صورت آماره دوربین- واتسون به صورت زیر محاسبه می شود:

مقدار آماره این آزمون در دامنه 0 الی 4+ قرار دارد:
اگر آنگاه خواهد بود که نشان می دهد خطاها از یکدیگر مستقل هستند (عدم خود همبستگی).
اگر آنگاه خواهد بود که نشان می دهد خطاها دارای خود همبستگی مثبت هستند.
اگر آنگاه خواهد بود که نشان می دهد خطاها دارای خود همبستگی منفی هستند.
فرض آماری این آزمون بصورت زیر بیان می شود:
عدم همبستگی بین خطاها
همبستگی بین خطاها وجود دارد
چنانچه این آماره در بازه 5/1 الی 5/2 قرار گیرد (عدم همبستگی بین خطاها) پذیرفته می شود و در غیر اینصورت رد می شود (همبستگی بین خطاها وجود دارد) (مومنی، 1386).

3-8-11- روش های ورود متغیرها در رگرسیون
روش های ورود متغیر ها در رگرسیون عبارتند از (مومنی، 1386):
روش وارد کردن:47 رویکردی در انتخاب متغیرها است که در آن کلیه متغیرهای وارد شده در «یک مرحله» در تعیین رگرسیون مورد استفاده قرار می گیرند.
روش گام به گام:48 در این روش متغیرهای مستقل یکی یکی به معادله رگرسیون اضافه می شوند و اگر نقش معنی داری در رگرسیون نداشته باشند (با توجه به sig آزمون خطی بودن رابطه متغیر ها) از آن حذف می شوند. معمولا هنگامی از این روش استفاده می شود که محقق دارای یک چارچوب نظری باشد.
روش حذف:49 رویکردی در انتخاب متغیرها است که در آن کلیه متغیرهای وارد شده در یک مرحله حذف می شوند.
روش حذف رو به عقب متغیرهای مستقل:50 روشی در انتخاب متغیرها که در آن ابتدا تمامی متغیرهای مستقل به معادله رگرسیون وارد شده و سپس در صورتیکه معیارهای لازم جهت باقی ماندن در مدل را نداشته باشند، تک تک حذف می شوند. (معمولا متغیرهای دارای ضریب همبستگی پایین تر با متغیر وابسته، حذف می شوند)
روش انتخاب رو به جلو متغیرهای مستقل:51 روشی در انتخاب متغیرهای مستقل که در آن تنها متغیرهایی که از معیارهای لازم جهت ورود به معادله رگرسیون (متغیرهای مستقل با ضریب همبستگی مثبت یا منفی بالاتر، اولین گزینه جهت ورود به معادله می باشند) برخوردارند وارد مدل می شوند.

فصل چهارم
تجزیه و تحلیل داده ها

4-1- مقدمه‏
پژوهش علمی تجزیه تحلیل داده های آماری جمع آوری شده از نمونه های آماری مرحله مهمی از تحقیق تلقی می شود به علت اینکه محقق، در این مرحله به نتیجه نهایی خواهد رسید . یعنی با استفاده از یک روش تحقیق، داده ها تجزیه و تحلیل و فرضیه آزمون و نهایتاً نتیجه گیری نهایی برای گزارش انجام خواهد شد .
تجزیه و تحلیل داده ها فرآیند چند مرحله ای است که طی آن داده هایی که از طریق بکارگیری ابزارهای جمع آوری درنمونه(جامعه)آماری فراهم آمده اند. خلاصه کد بندی و دسته بندی و نهایتاً پردازش می شوند تا زمینه برقراری انواع تحلیل ها و ارتباط های این داده ها به منظور آزمون فرضیه فراهم آید. دراین فرآیند داده ها هم ازلحاظ مفهومی واز هم جنبه تجربی پالایش می شوند.
در این فصل، اطلاعات مربوط به 117 شرکت که نمونه آماری ما را تشکیل داده اند در دوره زمانی 1390-1381 مورد تجزیه و تحلیل قرار گرفته اند تا ارتباط بین متغیرها برای آزمون فرضیه تحقیق بررسی شود. داده های جمع آوری شده با استفاده از نرم افزار Excel محاسبه و با نرم افزار Spss و تکنیک آماری رگرسیون ساده خطی مورد تجزیه و تحلیل قرار گرفته اند.

4-2- شاخص توصیفی متغیرها
به منظور شناخت بهتر ماهیت جامعه ای که در پژوهش مورد مطالعه قرار گرفته است. و آشنایی بیشتر با متغیر های پژوهش، قبل از تجزیه و تحلیل داده های آماری لازم است این داده توصیف شود. همچنین توصیف آماری داده ها گاهی در جهت تشخیص الگوی حاکم بر آن و پایه ای برای تبیین روابط بین متغیرهایی است که در پژوهش به کار می رود ( خورشیدی و قریشی ، 1381)
در بخش آماری توصیفی، تجزیه و تحلیل داده ها با استفاده از شاخص مرکزی همچون میانگین و شاخص پراکندگی انحراف معیار52، انجام پذیرفته است.
بنابراین قبل از آنکه به آزمون فرضیه های پژوهشی پرداخته شود متغیرهای پژوهش به صورت خلاصه در جدول شماره (4-1 ) مورد بررسی قرار می گیرد.
این جدول حاوی شاخص هایی برای