مدل های داده محور در هیدرولوژی کاربرد زیادی دارند و یکی از آن ها مدل رگرسیون خطی چند متغییره است. در این نوشته به معرفی این روش پرداخته شده است و در آخر یک مدل بارش رواناب با استفاده از رگرسیون خطی چند متغییره ایجاد شده است.
با استفاده از رگرسیون خطی چند متغیره میتوان رابطه خطی بین مجموعهای از متغیرهای مستقل با یک متغیر وابسته را به شیوهای بررسی کرد که در آن، روابط موجود فی مابین متغیرهای مستقل نیز مورد ملاحظه قرار گیرد و وظیفه رگرسیون این است که به تبیین واریانس متغیر وابسته کمک کند و این وظیفه تا حدودی از طریق برآورد مشارکت متغیرها در این واریانس به انجام میرسند. تحلیل رگرسیون چند متغیره برای مطالعه تأثیرات چند متغیر مستقل در متغیر وابسته کاملاً مناسب است.
در رگرسیون چند متغیره، مقادیر یک متغیر(متغیر وابسته یا y) از روی مقادیر دو یا چند متغیر دیگر (متغیرهای مستقل x1, x2, …,xk) برآورد میشود. این کار از طریق ساختن یک معادله خطی به شکل زیر انجام میشود.
f(y)=ax0+bx1+…+zxn
مفروضات رگرسیون خطی چند متغییره
جهت استفاده از رگرسیون خطی باید شرایط زیر ایجاد گردد
میانگین (امید ریاضی) خطاها صفر باشد
واریانس خطاها ثابت باشد
بین خطاهای مدل، همبستگی وجود نداشته باشد. به منظور بررسی این شرط از آزمون دوربین-واتسون استفاده میشود
متغیر وابسته مقیاس فاصلهای یا نسبی و دارای توزیع نرمال باشد
رگرسیون خطی در نرم افزار SPSS
برای ورود متغیرهای رگرسیونی به مدل، چهار روش اصلی وجود دارد که در ادامه توضیح داده می شود.
روش همزمان (Enter Method)
در این روش کلیه متغیرهای مستقل بطور همزمان وارد مدل می شوند تا تأثیر کلیه متغیرهای مهم و غیر مهم بر متغیر وابسته مشخص گردد. در این روش تمام متغیرها در یک مرحله به ترتیب حداقل تولرانس وارد تحلیل می شوند. یکی از مشکلات روش همزمان این است که چون تمامی متغیرها بدون توجه به ضریب همبستگی شان با متغیر وابسته وارد معادله می شوند بنابراین احتمالاً متغیرهایی هم که حضورشان در معادله معنی دار نیست، در آن باقی می مانند که در اثر حضور نابجا، مقادیر F و R2 کاهش می یابد.
روش حذف پس رو (Backward Method)
در این روش همانند روش Enter ابتدا کلیه متغیرهای مستقل وارد معادله شده و اثر کلیه متغیرها روی متغیر وابسته سنجیده می شود. اما بر خلاف روش Enter، در این روش به مرور متغیرهای ضعیف تر و کم اثرتر یکی پس از دیگری از معادله خارج شده و در نهایت این مراحل تا زمانی ادامه می یابد که خطای آزمون معنی داری به ده درصد برسد.
روش پیش رونده (Froward Method)
ابتدا همبستگی ساده بین هر یک از متغیرهای مستقل را با متغیر وابسته محاسبه می شود. سپس متغیر مستقلی که بیشترین همبستگی را با متغیر وابسته دارد و به عبارتی بیشترین مقدار واریانس را تبیین می کند، وارد تحلیل می کند. دومین متغیری که وارد تحلیل می شود، متغیری است که پس از تفکیک متغیر اول، بیشترین ضریب همبستگی را با متغیر وابسته دارد.
روش گام به گام (Stepwise Method)
در این روش، مانند روش Foreward متغیرها یک به یک وارد مدل می شوند. یعنی ابتدا متغیری که بیشترین همبستگی را با متغیر وابسته دارد انتخاب می شود. دومین متغیری که وارد تحلیل می شود متغیری است متغیری است که پس از تفکیک متغیر مقدم بر آن موجب بیشترین افزایش در مقدار ضریب R2 می شود. فرق اصل این روش با روش Forward در آن است که در روش Forward متغیرهای وارد شده در تحلیل در معادله باقی می مانند ولی در روش Stepwise با ورود متغیر جدید، متغیرهایی که قبلاً وارد معادله شده اند از نو آزموده می شوند تا مشخص گردد آیا هنوز هم حضور آن ها در مدل به موفقیت آن کمک می کند یا خیر؟ بنابراین احتمال دارد برخی از متغیرهایی که در مرحله اول قدرت تبیین بالایی داشته اند در مرحله بعدی حذف شوند.
مدل رگرسیون خطی
در این جا با استفاده از روش Enter و با استفاده از داده های بارش و رواناب مدل رگرسیونی خطی چند متغییره بارش رواناب با استفاده از دبی های روز قبل، دو روز قبل، و بارش های این روز ها یک مدل رگرسیون خطی ساخته شده است.
در تصویرر زیر محل قرار گیر مدل رگرسیون خطی چند متغییره آمده است.
در شکل زیر متغییر وابسته و متغییرهای مستقل را به SPSS معرفی می کنیم. در این جا دبی امروز متغییر وابسته و داده های بارش و رواناب روزهای قبل متغییر مستقل هستند.
نتیجه مدل در جدول زیر آمده است.