Корреляционный и регрессионный анализ
ЗАДАНИЯ ДЛЯ ПРАКТИЧЕСКИХ ЗАНЯТИИ
Робинзон Крузо уже несколько лет живет на необитаемом острове. Пытаясь выжить и наметив для этого огромное количество работы, он понимает, что ему необходимо каким-то образом упорядочить свою жизнь. Для этого он решает оптимизировать свою повседневную деятельность, а наше дело - помочь ему! Используя при этом методы эконометрики...
Ситуация 1: «Робинзон на охоте». Каждый раз, отправляясь охотиться на уток, Робинзон берет с собой флягу пива собственного приготовления, так как в условиях субтропиков ему постоянно хочется пить. При этом он отмечает среднюю температуру в день охоты (в градусах Цельсия, X3),количество убитых уток (в штуках, X2)и сколько при этом было выпито пива (в процентах от объема фляги, X1).
ИСХОДНЫЕ ДАННЫЕ ДЛЯ ВСЕХ 3-Х ЗАДАНИЙ:
Вариант X1 X2 X3
1 10 20 24
2 84 8 35
3 78 2 33
4 28 13 25
5 52 8 28
6 92 4 37
7 76 5 35
8 100 2 40
9 0 20 22
10 71 11 32
11 13 18 21
12 13 13 20
13 10 19 24
14 49 15 33
15 86 4 34
16 9 19 20
17 16 17 21
18 69 7 30
19 65 7 34
20 32 12 25
21 6 15 22
22 35 11 30
23 67 6 37
24 48 13 25
25 77 3 32
26 34 11 23
27 100 0 38
28 95 3 36
29 62 5 35
30 33 14 24
31 57 10 28
32 48 10 33
33 95 7 35
34 41 15 30
35 72 7 37
36 100 5 39
37 43 14 26
38 50 10 29
39 80 2 37
40 71 6 37
41 100 4 38
42 25 15 22
43 42 13 31
44 23 19 23
45 76 4 33
46 4 17 21
47 68 6 30
48 49 14 31
49 81 3 36
50 10 18 25
ЗАДАНИЕ 1. ПЕРВИЧНЫЙ ЭКОНОМЕТРИЧЕСКИЙ АНАЛИЗ. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
Цель: закрепить знания по теории вероятностей и математической статистике, касающиеся первичной обработки экспериментальных данных; ознакомиться с основными положениями, понятиями и методами проведения корреляционного анализа данных.
Порядок выполнения задания
1. По имеющимся результатам наблюдений для каждого показателя определить основные статистические характеристики (среднее, медиану, дисперсию, среднеквадратическое отклонение, коэффициенты асимметрии и эксцесса, коэффициент вариации, используя стандартные функции Excel – СРЗНАЧ(), МЕДИАНА(), ДИСП(), СТАНДОТКЛОН(), СКОС() и ЭКСЦЕСС() соответственно), сделать предварительные выводы о свойствах выборки.
2. Провести разбиение выборок на классы однородности, построить кумулятивные линии эмпирического распределения и гистограммы. Проанализировать полученные графики.
3. Сформулировать и проверить гипотезу согласии выборочных данных с нормальным распределением на основе критерия х2-Пирсона. Сделать выводы.
4. Нанести исходные данные на координатную плоскость и сделать обоснованное предварительное заключение о наличии (отсутствии) связи между всеми парами факторов, а также о ее характере (положительная или отрицательная) и форме (линейная или нелинейная).
5. Рассчитать парные коэффициенты корреляции для каждой пары показателей. Построить корреляционную матрицу. Используя t-критерий Стьюдента, проверить значимость полученных коэффициентов корреляции. Сделать выводы о тесноте связи между факторами.
6. Для каждой пары показателей вычислить частный коэффициент корреляции и проверить его на значимость. Для значимых коэффициентов построить 95% доверительные интервалы. Сделать выводы.
7. Вычислить все возможные множественные коэффициенты корреляции. Сделать выводы.
8. По результатам работы сделать общие выводы и сформулировать рекомендации для Робинзона.
ЗАДАНИЕ 2.
ОСНОВЫ РЕГРЕССИОННОГО АНАЛИЗА. ПАРНАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ
Цель: ознакомиться с основными положениями, понятиями и методами анализа линейной модели парной регрессии.
По результатам корреляционного анализа (см. задание 1) выбрать пару показателей, которые связаны наиболее тесно, обозначив их X и Y соответственно. Полагая, что связь между ними может быть описана линейной функцией, записать уравнения Y = f(X) и X = g(Y),определяющие искомую связь.
Порядок выполнения задания
1. Вычислить оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Дать содержательную интерпретацию результатов и выбрать для дальнейшего анализа одно из уравнений.
2. Построить и проанализировать графическую интерпретацию всех трех моделей регрессии и исходных данных.
3. Проверить значимость всех параметров выбранной модели регрессии по критерию Стьюдента. Для значимых коэффициентов построить доверительные интервалы. Сформулировать выводы.
4. Проверить значимость модели (уравнения регрессии) в целом с помощью критерия Фишера. Сформулировать выводы.
5. Построить таблицу дисперсионного анализа.
6. Выбрать прогнозную точку хп в стороне от основного массива данных. Используя уравнение регрессии, выполнить точечный и интервальный прогнозы величины Yв точке х . Проанализировать полученные результаты.
7. Построить 95% доверительный интервал для уравнения регрессии на всем диапазоне исходных данных. Изобразить в одной системе координат исходные данные, линию регрессии, 95% доверительный интервал, проанализировать полученный график.
8. Сделать общие выводы, касающиеся проделанной работы и эконометрической интерпретации полученных результатов, разработать рекомендации.
ЗАДАНИЕ 3
ОСНОВЫ РЕГРЕССИОННОГО АНАЛИЗА. МНОЖЕСТВЕННАЯ РЕГРЕССИЯ
Ситуация 2. «Орехи и виноград». В соответствии с рекомендациями книги о вкусной и здоровой пище, спасенной Робинзоном с корабля, он хочет расширить свое меню. Для этого кроме охоты на уток Робинзон решил заняться сбором дикого винограда и орехов. В период сбора урожая Робинзон с утра выходил в лес с большой корзиной, собирал орехи с виноградом и к обеду возвращался. Со временем Робинзон заметил, что вес собранного (Y, фунты) зависит от количества обобранных кустов винограда (X1,шт.) и количества обобранных кустов орешника (X2,шт.). Необходимо построить модель этой зависимости.
Цель: ознакомиться с основными положениями, понятиями и методами анализа линейных моделей множественной регрессии.
Порядок выполнения задания
1. Записать уравнение зависимости веса собранного урожая от количества обобранных кустов винограда и орешника. Пояснить введенные обозначения.
2. С помощью метода наименьших квадратов найти оценки всех неизвестных параметров уравнения регрессии. Проинтерпретировать результаты.
3. Проверить значимость параметров уравнения по критерию Стьюдента. Для значимых коэффициентов построить доверительные интервалы. Сделать выводы.
4. Вычислить коэффициент детерминации и проверить на значимость построенное регрессионное уравнение. Сделать выводы.
5. На основе частных коэффициентов эластичности провести ранжирование факторов по степени воздействия на отклик. Сделать выводы.
6. Построить 95% доверительный интервал для уравнения регрессии на всем диапазоне исходных данных.
7. Изобразить в одной системе координат исходные данные, линию регрессии, 95% доверительный интервал.
8. Сделать общие выводы, касающиеся проделанной работы и эконометрической интерпретации полученных результатов, разработать рекомендации.