Зошит з курсу «Теорія ймовірності та Математичної статистики»
Практичне заняття № 15. Тема: Обчислення коефіцієнта кореляції, побудова прямих регресій.
Приклад 1. Отримано вибіркові данні про ціни на квартири та загальну їх площу в місті N, січень 2009 р.
|
|
13,8 |
13,8 |
14 |
22,5 |
24 |
28 |
32 |
20,9 |
22 |
21,5 |
32 |
35 |
24 |
37,9 |
27,5 |
|
|
33 |
40 |
36 |
60 |
55 |
80 |
95 |
70 |
48 |
53 |
95 |
75 |
63 |
112 |
70 |
- загальна площа квартири, кв.м;
- ринкова ціна квартири, тис. у.е.
Необхідно:
1. Побудувати графік залежності між змінними, по якому необхідно підібрати модель рівняння регресії.
2. Розрахувати параметри рівняння регресії методом найменших квадратів.
3. Знайти коефіцієнт еластичності.
4. Оцінити тісноту зв’язку між змінними за допомогою показників кореляції та детермінації.
Розв’язання. Графік залежності змінних Х та Y будується у прямокутній системі координат. На осі абсцис відкладаються значення факторної ознаки Х, а по вісі ординат – результативної ознаки Y. Враховуючи невелике число пар значень змінних, по кожній з них виділимо 5 інтервалів, використовуючи формулу:
,
де h – довжина інтервалу,
хmin – найменше значення ознаки,
хmax – найбільше значення ознаки,
k – число інтервалів.
Для змінної Х:
Для інтервалу округлюється в сторону збільшення для зручного значення,
=16.
В результаті отримаємо наступні границі інтервалів: 33+16=49; 49+16=65; 65+16=81; 81+16=97; 97+16=113.
Аналогічно, для змінної Y:
Границі інтервалів складають: 13; 18; 23; 28; 33; 38.
На графік наносяться точки, координати яких відповідають значенням Y та X. Характер розташування точок на графіку показує, що зв'язок між змінними може виражатися лінійним рівнянням регресії:
.

Рис.1. Залежність ціни на квартири від загальної їх площі
2. Параметри рівняння регресії знаходимо методом найменших квадратів, шляхом складання та розв’язання системи нормальних рівнянь.
Для проведення усіх розрахунків будується допоміжна таблиця.
В таблиці усі середні знаходяться за формулою середньої арифметичної простої:
.
Підставимо отриманні суми в систему рівнянь, враховуючи, що n=15:

Розв’язавши систему, отримуємо b0=4,7743; b1=0,3018.
Параметри рівняння регресії також можна знайти за формулами, які отримано шляхом використання правила Крамера розв’язання системи лінійних алгебраїчних рівнянь.
Допоміжна таблиця:
|
№ п/п |
x |
y |
x2 |
y2 |
xy |
|
y- |
(y- |
|
1 |
33 |
13,8 |
1089 |
190,44 |
455,4 |
14,734 |
-0,934 |
0,873 |
|
2 |
40 |
13,8 |
1600 |
190,44 |
552 |
16,847 |
-3,047 |
9,283 |
|
3 |
36 |
14 |
1296 |
196 |
504 |
15,640 |
-1,640 |
2,688 |
|
4 |
60 |
22,5 |
3600 |
506,25 |
1350 |
22,883 |
-0,383 |
0,147 |
|
5 |
55 |
24 |
3025 |
576 |
1320 |
21,374 |
-2,626 |
6,896 |
|
6 |
80 |
28 |
6400 |
784 |
2240 |
28,919 |
-0,919 |
0,845 |
|
7 |
95 |
32 |
9025 |
1024 |
3040 |
33,447 |
-1,447 |
2,092 |
|
8 |
70 |
20,9 |
4900 |
436,81 |
1463 |
25,901 |
-5,001 |
25,012 |
|
9 |
48 |
22 |
2304 |
484 |
1056 |
19,261 |
2,739 |
7,500 |
|
10 |
53 |
21,5 |
2809 |
462,25 |
1139,5 |
20,770 |
0,730 |
0,532 |
|
11 |
95 |
32 |
9025 |
1024 |
3040 |
33,447 |
-1,447 |
2,092 |
|
12 |
75 |
35 |
5625 |
1225 |
2625 |
27,410 |
7,590 |
57,604 |
|
13 |
63 |
24 |
3969 |
576 |
1512 |
23,788 |
0,212 |
0,045 |
|
14 |
112 |
37,9 |
12544 |
1436,41 |
4244,8 |
38,577 |
-0,677 |
0,459 |
|
15 |
70 |
27,5 |
4900 |
756,25 |
1925 |
25,901 |
1,599 |
2,556 |
|
Всього |
985 |
368,9 |
72111 |
9867,85 |
26466,7 |
368,899 |
-0,001 |
118,625 |
|
Середнє значення |
65,667 |
24,593 |
4807,4 |
657,857 |
1764,447 |
24,593 |
- |
7,908 |


Невеликі розбіжності в результатах розрахунків пояснюються заокругленням середніх значень в другому випадку.
Таким чином, рівняння регресії має вигляд
Коефіцієнт регресії показує, що при збільшені загальної площі квартири на 1 м2 ціна квартири в середньому збільшиться на 0,3018 тис. У.є., або на 301,8 у.є.
Якщо в рівнянні регресії підставити фактичні значення змінної Х, то визначаються можливі (теоретичні) значення змінної
, які наносяться на графік у вигляді рівняння прямої.
3. При лінійній формі зв’язку середній коефіцієнт еластичності знаходиться за формулою Э
, де
– середні значення ознак.
Э=
Коефіцієнт еластичності показує, що при збільшенні загальної площі квартири на 1% її ціна в середньому виросте на 0,806 %.
4. При лінійній залежності, ступінь тісноти зв’язку між змінними
визначається за допомогою коефіцієнта кореляції:
, де
та
– середні квадратичні відхилення по X та Y.


=0,922.
Так як значення коефіцієнта кореляції близьке до одиниці, то між ознаками зв'язок дуже тісний, пряма, близька до лінійної функціональної.
Коефіцієнт детермінації r2=0,9222=0,850 показує, що 85 % відмінностей в ціні квартир пояснюється варіацією їх загальної площі, а 15 % - іншими, неврахованими факторами (місцезнаходження квартир, благоустрій території, розвинена інфраструктура т. і.).
12 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32



2