رفتن به مطلب

تحلیل رگرسیون


ارسال های توصیه شده

تحلیل رگرسیون داده روشی برای مدل‌سازی و تحلیل داده‌های عددی است. داده‌ها شامل مقدارهایی برای متغیر وابسته و یک یا چند متغیر مستقل هستند. هدف از تحلیل رگرسیون، بیان متغیر وابسته به شکل تابعی از متغیر(های) مستقل، ضرایب، و مقدارهای خطا است. مقدارهای خطا متغیرهای تصادفی‌ای هستند که تغییرات توضیح‌داده‌نشده در مقدار متغیرهای مستقل را نشان می‌دهند.

در این روش، ضرایب به گونه‌ای تعیین می‌شوند که بهترین برازش (fit) را به داده‌ها داشته باشند. معمولاً بهترین برازش را با روش کمترین مربعات می‌یابند، هرچند که روش‌های دیگری هم وجود دارد.

 

تحلیل رگرسیون برای پیش‌بینی مقادیر آیندهٔ متغیر وابسته، آزمودن نظریه‌ها، و تحلیل پدیده‌شناختی پدیده‌ها به کار می‌رود. این تحلیل تنها وقتی معتبر است که پیش‌فرض‌هایش برآورده شوند. از تحلیل رگرسیون به خاطر استفاده‌های نابه‌جایی که به خاطر برآورده‌نشدن این پیش‌فرض‌ها از آن شده است، انتقاد کرده‌اند.

یک انتقاد مهم به این روش این است که با آن به آسانی می‌توان داده‌ها را به یک مدل برازش کرد، ولی به‌چالش کشیدن مدل با این روش کار آسانی نیست.

 

 

رگرسیون خطی

 

در رگرسیون خطی، متغیر وابسته yi ترکیب خطی‌ای خطی از ضرایب (پارامترها) است (لازم نیست که نسبت به متغیرهای مستقل خطی باشد). مثلاً تحلیل رگرسیونی سادهٔ زیر با N نقطه، متغیر مستقل xi و ضرایب β0 و β1 خطی است:

خط راست: 3a758e9d250a4555cf1f5756c040e168.png

 

در رگرسیون چندگانه، بیش از یک متغیر مستقل وجود دارد:

 

سهمی: 42ef4f87aecbc033cd660e0b06a558a1.png

 

این همچنان رگرسیون خطی است، زیرا yi همچنان ترکیب خطی پارامترها (β0 و β1) است، هرچند که نسبت به متغیر مستقل (xi) خطی نیست.

 

در هر دو حالت، εi مقدار خطاست و پانویس i شمارهٔ هر مشاهده (هر جفت xi و yi) را نشان می‌دهد. با داشتن مجموعه‌ای از این نقطه‌ها می‌توان مدل را به دست آورد:

 

f9bd00964ab62e093bf70dac68b543ef.png

 

عبارت ei مانده نام دارد: 9f118e59309bb88414d83f287e372e1e.png . روش رایج برای به‌دست‌آوردن پارامترها، روش کمترین مربعات است. در این روش پارامترها را با کمینه‌کردن تابع زیر به دست می‌آورند:

 

bd6b1ec6c669797fc6bd620b48dc278e.png

 

در مورد رگرسیون ساده، پارامترها با این روش برابر خواهند بود با:

 

7c999cfe2ab08a75333b6fcab42b78fb.png

 

که در آن 84790e2b15a305120bc3fbeb4a4eeb4f.png و 10b9fdacffcecc3574e9306610427486.png میانگین x و y هستند.

  • Like 1
لینک به دیدگاه
×
×
  • اضافه کردن...