کاربرد آزمون F لیمر(آزمون چاو) در اکسل

مقدمه
برای درک بهتر آزمون چاو(آزمون F لیمر) و کاربرد آن در اقتصاد و حسابداری ابتدا پانل دیتا تعریف می شود
تعریف داده های پانلی
داده های پانلی یا ترکیبی، مجموعه ای از داده ها هستند که شامل چند مقطع و یک دوره زمانی می باشند. مقطع می تواند بیانگر افراد، گروه ها، بنگاه ها، صنایع، کشورها و . . . باشد، که البته مقطع معمولا شرکتهای بازار بورس یا کشورها می باشد. دوره زمانی نیز چند سال یا چند نیم سال می باشد.
در یک تعریف عملیاتی، داده های پانل داده هایی هستند که به جای یک بعد (که معمولا سال ها است)، دارای دو بعد زمان (سال) و مقطع (شرکتها) می باشد. به همین دلیل دو بعدی بودن از نام های داده های ترکیبی یا داده های تابلویی برای آن استفاده می شود.
توضیح بیشتر این است که؛
در مباحث اقتصادسنجی داده ها دارای سه حالت می باشند:
سری های زمانی: که در آن داده هایی را بر حسب زمان در اختیار داریم. مثل نرخ تورم کشور طی ۲۰ سال اخیر
داده های مقطعی: که در آن داده هایی را بر حسب مقاطع (نام شرکتها یا نام کشورها) در اختیار داریم. توجه شود که در اینجا زمان ثابت فرض می شود. مثل نرخ تورم در کشورهای اپک در سال ۱۳۹۵
داده های ترکیبی (پانل): در این نوع داده ها هر دو بعد فوق را داریم. به عبارت دیگر داده هایی داریم که در آنها هم سری زمانی است و هم مقاطع مختلف. مثل نرخ تورم در کشورهای اپک طی ۲۰ سال اخیر
مزایای پانل دیتا
1-با ترکیب مشاهدات سری زمانی و مقطعی، داده های ترکیبی اطلاعات بیشتر، تغییر پذیری بیشتر، هم خطی کمتر میان متغیرها، درجات آزادی بیشتر و کارایی بیشتری را ارائه می کنند.
2-در مطالعه مشاهدات مقطعی تکراری، داده های ترکیبی به منظور مطالعه پویای تغییرات مناسب تر و بهترند. دوره های بیکاری، چرخش شغلی و تحرک نیروی کار با داده های ترکیبی بهتر بررسی می شوند.
3-داده های ترکیبی، تاثیراتی را که نمی توان به سادگی در داده های سری زمانی و مقطعی مشاهده کرد، بهتر معین می کنند. برای مثال، اگر نوسان پیاپی افزایش حداقل دستمزد را در حداقل حقوق و دستمزد بررسی کنیم، اثرات قوانین حداقل دستمزد را بر اشتغال و کسب درآمد بهتر می توان مطالعه کرد.
4-داده های ترکیبی با ارائه داده برای هزاران واحد، می توانند تورشی را که ممکن است در نتیجه لحاظ افراد یا بنگاه های اقتصادی (به صورت جمعی و کلی) حاصل شود، به حداقل برسانند.
5-از آنجا که داده های ترکیبی به افراد، بنگاه ها، شرکتها و کشورها و از این قبیل واحدها، در طی زمان ارتباط دارند، وجود ناهمسانی واریانس در این واحدها محدود می شود.
به طور کلی باید گفت، داده های ترکیبی، تحلیل های تجربی را به شکلی غنی می سازند که در صورت استفاده از داده های سری زمانی یا مقطعی این امکان وجود ندارد. البته نمی توان گفت که مدل سازی با داده های ترکیبی هیچ مشکلی ندارد.
تفاوت مدل پانل(panel) با مدل تجمیعی (pooled)
مدل تجمیعی یا پولد (که به آن مقید نیز می گویند) بیانگر آن است که اثرات فردی وجود ندارد و {عرض از مبدا} همه گروه ها یکسان هستند.
در برآورد یک مدل رگرسیون با داده های پانل، وقتی که به این نتیجه می رسیم که در مدل خود، عامل مقطع (کشورها یا شرکتها) یا عامل زمان (سال) را می توانیم نادیده بگیریم و تفاوت معنی داری بین کشورهای مختلف یا شرکتهای مختلف وجود ندارد، می گوییم (pooled) هستند. به عبارت دیگر وقتی مدل ما پانل نباشد، مدل pooled می باشد.
به زبان ساده، وقتی مقاطع و زمان باعث اتفاق خاصی در مدل رگرسیون ما نشده و می توانیم آنها را نادیده بگیریم، به یک رگرسیون معمولی بر روی داده ها و متغیرها خواهیم رسید که به به آن مدل پولد یا تجمیعی یا مقید می گویند.
برای سنجش اینکه داده ها پانل هستند یا پولد از آزمون f لیمیر که آزمون چاو نیز می گویند استفاده می شود. بهرحال وقتی داده ها پولد نبودند یا پانل با اثرات ثابت هستند و یا پانل با اثرات تصادفی.
توجه شود که آزمون هاسمن برای مرحله بعدی و بعد از آزمون F لیمر استفاده می شود. یعنی وقتی که متوجه شدیم با مدل پانل مواجه هستیم و در نتیجه اثرات ثابت یا تصادفی وجود دارد، از آزمون هاسمن برای تعیین مدل با اثرات ثابت و یا مدل با اثرات تصادفی استفاده می کنیم.
کاربرد آزمون F لیمر (F Limer) در حسابداری
در برآورد یک مدل یا فرضیه که داده های آن از نوع ترکیبی است مثلاً رابطه افزایش سود سهام با افزایش سهامداران از آزمون F لیمر (چاو) استفاده میکنیم در واقع ما در این آزمون با دو طبقه PooL و PaneL سروکار داریم.
در واقع با این آزمونها دادههای ثابت بین مقاطع مختلف را بررسی میکنیم. اگر نتیجه آزمون F از سطح 5% کمتر باشد از آزمون هاسمن استفاده میکنیم و اگر نتیجه از سطح 5% بیشتر باشد یعنی ارتباط معنی داری بین داده های فرضیه وجود دارد اصطلاحاً اگر نتیجه آزمون F از سطح 5% بیشتر باشد اصطلاحاً پولد یا تلفیقی هستند و نیازی به انجام آزمون هاسمن ندارند ولی اگر از سطح 5% کمتر باشند اصطلاحاً پانل یا تابلویی هستند و باید برای قسمت مدل (فرضیه) از آزمون هاسمن استفاده شود.
در حقیقت از آزمون F لیمر برای تعیین اینکه متغیرهای مستقل اثرهایی متفاوت بر زیرگروههای متفاوت جامعه آماری دارند، استفاده میشود.
اگر مقدار F محاسبه شده از F دامنه بحرانی بیشتر باشد فرضیه H0 رد میشود یعنی همگنی بین دادهها وجود ندارد ولی اگر F از F دامنه بحرانی کمتر باشد فرضیه H0 پذیرفته میشود به عبارت دیگر شیب داده ها در مقاطع مختلف باهم یکسان است در مثال زیر میخواهیم فرضیه بین مبلغ فروش و هزینه بازاریابی را بررسی کنیم این مثال برای 12 ماه سال 1399 میباشد.
هزینه بازاریابی | مبلغ فروش | ماه |
100.023 | 2.450.000 | فروردین |
23.001 | 1.230.000 | اردیبهشت |
0 | 5.420.000 | خرداد |
10.200 | 6.003.333 | تیر |
520.000 | 7.488.333 | مرداد |
0 | 8.973.333 | شهریور |
0 | 10.458.333 | مهر |
120 | 11.943.333 | آبان |
65.354 | 13.428.333 | آذر |
61.729 | 14.913.333 | دی |
58.103 | 16.398.333 | بهمن |
54.478 | 17.883.333 | اسفند |
893.009 | 116.590.000 | جمع کل |
نتایج آزمون F لیمر با اکسل
متغیر دوم(مبالغ هزینه بازاریابی) | متغیر اول(مبالغ فروش) |
|
74417.38095 | 9715833.333 | میانگین |
20818893902 | 29111381060606 | انحراف معیار |
12 | 12 | مشاهدات |
11 | 11 | درجه آزادی |
| 1398.315453 | F |
| 15 – E1.19665 | P(F < = f) one – tail |
| 2.81793047 | F Critical one - tail |
همانطور که مشاهده میکنید مقدار F از دامنه بحرانی (F Critical one- tair) F بیشتر است بنابراین فرضیه رد میشود یعنی همگنی بین دادهها وجود ندارد به عبارت دیگر میتوان گفت بین هزینه بازاریابی و مبلغ فروش رابطه معناداری وجود ندارد.
در محاسبات بالا از نرم افزار اکسل بهره گرفته شده است. اعداد فرضی هستند و این محاسبات جنبه نمایش چگونگی انجام آزمون F لیمر (آزمون چاو) با اکسل دارد.
برای اینکار ما از قسمت Data و گزینه Data Analysis اقدام کردیم.
سپس در کادر ظاهر شده گزینه F-Two Sample را انتخاب کردیم.
و برروی دکمه OK کلیک کرده و در کادر ظاهر شده ستون های داده را انتخاب کردیم.
بعد از کلیک برروی دکمه Ok نتایج مانند جدول فوق محاسبه و نمایش داده شد.
متغیر دوم(مبالغ هزینه بازاریابی) | متغیر اول(مبالغ فروش) |
|
74417.38095 | 9715833.333 | میانگین |
20818893902 | 29111381060606 | انحراف معیار |
12 | 12 | مشاهدات |
11 | 11 | درجه آزادی |
| 1398.315453 | F |
| 15 – E1.19665 | P(F < = f) one – tail |
| 2.81793047 | F Critical one - tail |
همانطور که مشاهده میکنید مقدار F از دامنه بحرانی (F Critical one- tail) F بیشتر است بنابراین فرضیه رد میشود یعنی همگنی بین دادهها وجود ندارد به عبارت دیگر میتوان گفت بین هزینه بازاریابی و مبلغ فروش رابطه معناداری وجود ندارد.

