Главная » Статьи » Студентам » Основы научных исследований

Метод регресійного аналізу. ЕКОНОМІКО-СТАТИСТИЧНІ МЕТОДИ АНАЛІЗУ ОБ’ЄКТА ДОСЛІДЖЕННЯ

Метод регресійного аналізу в MS Excel

Задача регресійного аналізу

Використовуючи дані завдання (рис. 1), проведемо регресійний аналіз за допомогою вбудованого в MS Excel модуля "Регресія".

Рис. 1. Вихідна інформація

Звіт регресійного аналізу в MS Excel

Загальний вигляд звіту

На рис. 2 наведено звіт регресійного аналізу в MS Excel з зазначенням зв’язків між характеристиками.

Рис. 2. Звіт регресійного аналізу в MS Excel

Дисперсійний аналіз у звіті

df – діапазон В12:В14 на листі звіту, зображеного на рис. 2 – кількість ступенів свободи пов’язано з кількістю одиниць сукупності n і з кількістю констант (k+1), що визначається за нею.

Чарунка С12 (рис. 2) містить пояснену суму квадратів (SS), зумовлену регресією:

Введемо

що є відхиленням істинного значення поясненої змінної від модельного значення для i-го спостереження.

Тоді чарунка С13 містить залишкову суму квадратів, що пояснює відхилення від регресії:

Таким чином, метод найменших квадратів полягає у виборі такого набору коефіцієнтів серед усіх можливих, що забезпечує мінімальне значення SS_oст.

Якщо всі коефіцієнти моделі, окрім константи є рівними нулю, тоді

тобто ця константа дорівнює середньому значенню поясненої змінної.

У такому випадку сукупна сума квадратів – чарунка С14 – дорівнює:

або

Вибіркове значення F, що має розподіл Фішера, у чарунці Е12, застосовується для оцінки надійності моделі в цілому, значущості коефіцієнта детермінації .

F і значущість F (F12) дозволяють перевірити значущість рівняння регресії, тобто встановити відповідність результатів регресійної моделі емпіричним даним і достатність незалежних змінних, внесених до неї, для опису залежної змінної.

За емпіричним значенням статистики F перевіряється гіпотеза рівності нулю всіх коефіцієнтів моделі одночасно.

Значущість F (F12) – це теоретична імовірність того, що при виконанні цієї гіпотези F-статистика більше емпіричного значення F. Потрібно, щоб

Значущість F < 0.05.

Рівняння регресії значимо на рівні , якщо

де

– табличне значення F-критерію Фішера:

Регресійна статистика

Множинний R (B4) – це коефіцієнт кореляції Пірсона. Застосовується при оцінці точності регресійної моделі. Його значення має перевищувати 0.7:

R > 0,7.

Коефіцієнт детермінації (чарунка В5) вказує на те, яка частка варіації поясненної змінної зумовлена варіацією змінної, що пояснює (). Чим ближче до одиниці, тим краще регресія апроксимує емпіричні дані. Якщо ж =1, томіж xі yіснує функціональна залежність, тоді як =0 свідчить про те, що пояснена зміна не залежить від обраного набору змінних, що пояснюють. При оцінці точності регресійної моделі вимагається, щоб:

R² > 0,5.

Нормований (скоригований чи адаптований) коефіцієнт детермінації в чарунці В6 визначається наступним чином:

На відміну від може зменшуватись при введенні в модель нових змінних, що пояснюють, але не здійснюють істотного впливу на залежну зміну, тоді як у таких випадках збільшується.

Стандартна помилка (B7 і F37), позначимо SE, використовується для оцінки точності моделі шляхом розрахунку дроби, яка не повинна перевищувати 0,3 (30%):

SE / (y_max – y_min) < 0,3,

Параметри рергесійного рівняння

В чарунках D18:D19 надана t-статистика або, іншими словами, коефіцієнти Стьюдента. В оцінці надійності моделі для кожної з незалежних змінних (x_i) значення коефіцієнтів Стюдента мають бути більше 2:

t_s > 2.

P-значення (F18:F19) – імовірність, що дозволяє визначити значущість коефіцієнтів регресії . Порівнюючи P-значення з рівнем значущості = 0.05 маємо правило.

Якщо P-значення більше або дорівнює , то коефіцієнт незначущий, через те гіпотеза приймається.

Отже, для оцінки надійності моделі, необхідно, щоб для незалежних змінних (x_i) виконувалась умова:

p < 0,05.

Нижні95%, Верхні95% (G17:H19) – довірчий інтервал для параметру

В оцінці надійності беруть до уваги, що довірчий інтервал не повинен містити 0.

Ці три показника є взамопов’язаними. Їх інтерпретація є однаковою: незалежні змінні (x_i) мають значущій вплив на залежну змінну (y).

Оцінка адекватності моделі здійснюється за коефіцієнтом автокореляції (r). При цьому важливо, щоб він прагнув до нуля, а його критичне значення дорівнює 0,3:

r → 0, r < 0,3.

Коефіцієнт автокореляції r розраховується як коефіцієнт кореляції для двох наборів даних їх одного стовпчика. Дивлячись на рис. 2, визначаємо перший набір, як значення з 1 по 9 (передостанній), а другий набір – значення з 2 по 10 (останній).

Категория: Основы научных исследований | Добавил: kvn2us0758 (29.08.2009) | Автор: Кравченко В.Н.

Просмотров: 17806 | Теги: регрессионный анализ, MS Excel

Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]