که معمولا در این حالت مخرج بزرگتر شده و بنابراین واریانس محاسبه شده کوچکتر از واریانس بدست آمده از دادههای سری زمانی است و بنابراین کارآیی تخمین افزایش مییابد.
به همین قیاس چنانچه آزمون F (آزمون معنی دار بودن کل رگرسیون) در دو حالت یعنی سری زمانی و ترکیبی مقایسه شود، داریم:
در مدل تنها سری زمانی:
در صورتیکه در مدل ترکیبی F به صورت زیر محاسبه میگردد:
به وضوح مشخص است که مقدار F در مدل ترکیبی میتواند بزرگتر از مدل تنها سری زمانی باشد و لذا احتمال معنیدار بودن کل رگرسیون یعنی وجود متغیرهای توضیحی در مدل ترکیبی بیشتر خواهد بود.
ب- دادههای ترکیبی امکان طراحی الگوهای رفتاری پیچیدهتری نسبت به دادههای مقطعی و سریهای زمانی صرف را فراهم میکند. برای مثال بوسیله دادههای ترکیبی امکان بهتری برای بررسی و مدلسازی کارایی تکنیکی وجود دارد.
ج- دادههای ترکیبی امکان بیشتری برای شناسایی و اندازهگیری اثراتی را فراهم میکند که بوسیله فقط آمارهای مقطعی و یا سری زمانی به سادگی قابل شناسایی نیست.
د- دادههای ترکیبی از واحدهای کوچکی مثل افراد، شرکتها و خانوارها گردآوری میشوند. خیلی از متغیرها را میتوان در مقیاس کوچک با دقت بیشتری اندازهگیری نمود و انحرافهای ناشی از تجمع افراد یا شرکتها حذف میشوند.
ه- امتیاز دیگری که برای ترکیب کردن دادهها میتوان در نظر گرفت این است که استفاده از مشاهدات مقطعی ممکن است منجر به برآوردهای اریبی از پارامترها شود. چنانچه از این برشهای مقطعی طی زمان نمونهگیری شود و به اصطلاح دادههای ترکیبی فراهم شود برآوردهای نااریب و سازگاری امکانپذیر است.
۳-۸-۳- روشهای تخمین
برآورد روابطی که در آنها از دادههای ترکیبی (سری زمانی، مقطعی) استفاده میشود، غالباً با پیچیدگیهایی مواجه است. در حالت کلی، مدل زیر نشان دهنده یک مدل ترکیبی است:
که در آن i=1,2,…,n نشان دهنده واحدهای مقطعی (مثلا شرکت ها) وt=1,2,…,t بر زمان اشاره دارد. متغیر وابسته iامین واحد مقطعی در سال t و نیز k امین متغیر مستقل غیر تصادفی برای i امین واحد مقطعی در سال t ام است. فرض میشود جمله اخلال دارای میانگین صفر یعنی و واریانس ثابت است. پارامترهای مدل مجهول است که واکنش متغیر وابسته نسبت به تغییرات k امین متغیر مستقل در i امین مقطع و t امین زمان را اندازهگیری میکند.
با توجه به مدل فوق، بسته به اینکه ضرایب متغیرها و عرض از مبدأها ثابت یا متغیر باشند، حالتهای مختلفی از مدلهای ترکیبی رخ میدهد که مدلهای تلفیقی، تابلویی، تابلویی با اثرات ثابت و تابلویی با اثرات متغیر از آن جمله هستند. در ادامه به نحوه تمایز بین این مدلها پرداخته میشود.
برای تخمین مدلها، ابتدا با استفاده از آزمون F لیمر، مشخص میشود که بایستی از مدل تابلویی استفاده شود یا مدل تلفیقی. آماره این آزمون به صورت زیر است:
که در آن:
RRSS: مجموع مجذورات پسماندهای مقید
URSS: مجموع مجذورات پسماندهای غیرمقید
K : تعداد متغیرهای توضیحی
N: تعداد مقطعها
در آزمون F ، فرضیه صفر یکسان بودن عرض از مبدأها (دادههای تلفیقی) در مقابل فرضیه مخالف، ناهمسانی عرض از مبدأها (روش دادههای تابلویی) قرار میگیرد. لذا میتوان نوشت:
اگر F محاسبه شده از F جدول با درجه آزادیهای N-1 و NT–N-K بزرگتر باشد، فرضیه صفر رد شده و استفاده از روش دادههای تابلویی بهتر است. در غیر این صورت از روش دادههای تلفیقی استفاده میشود .
اگر بر اساس آزمون F لیمر روش دادههای تابلویی انتخاب گردید، سؤال اساسی دیگری که مطرح خواهد شد این است که آیا تفاوت در مقاطع مختلف میتواند بوسیله عرض از مبدأ خاص در واحد پاسخگو باشد. به عبارت دیگر آیا تفاوت در عرض از مبدأ واحدهای مقطعی به طور ثابت عمل میکند یا اینکه عملکردهای تصادفی میتوانند این اختلاف بین واحدها را بطور واضحتری بیان نماید که به ترتیب این دو روش در ادبیات دادههای ترکیبی به روشهای ثابت و اثرات تصادفی مشهور هستند. برای تشخیص اینکه کدام مدل باید مورد استفاده قرار گیرد از آزمون هاسمن استفاده میشود. در واقع از آزمون هاسمن برای بررسی این موضوع که آیا عرض از مبدأ بصورت اثرات ثابت است یا اینکه در ساختار واحدهای مقطعی (شرکتها) بصورت تصادفی عمل میکند، استفاده میشود. فرضیه و آماره این آزمون به نحو زیر است:
:
:
در رابطه فوق:
: ماتریس واریانس- کوواریانس به روش اثرات تصادفی
: ماتریس واریانس- کوواریانس به روش اثرات ثابت
: برآورد به روش اثرات تصادفی
: برآورد به روش اثرات ثابت
درصورتی که فرضیه صفر رد شود باید از روش اثرات ثابت استفاده کرد و اگر این فرضیه پذیرفته شود روش اثرات تصادفی ملاک تجزیه و تحلیل قرار خواهد گرفت (اشراف زاده و مهرگان، ۱۳۸۷؛ زراء نژاد و انواری، ۱۳۸۴). به طور کلی آنچه که در مورد مدلهای ترکیبی و نحوه تشخیص این مدلها در بالا بیان شد را میتوان در شکل (۳-۱) نشان داده شده است.
شکل ۳-۱- آزمون های تشخیصی در دادههای ترکیبی
اثرات تصادفی
اثرات ثابت
داده های تلفیقی
داده های تابلویی
آزمون چاو
آزمون هاسمن
منبع فایل کامل این پایان نامه این سایت pipaf.ir است |