Deprecated: mysql_connect(): The mysql extension is deprecated and will be removed in the future: use mysqli or PDO instead in /home/studb20/public_html/index.php on line 4
 Практичне заняття № 15. Тема: Обчислення коефіцієнта кореляції, побудова прямих регресій. - Зошит з курсу «Теорія ймовірності та Математичної статистики» - Studbook
Главная->Математика->Содержание->Практичне заняття № 15. Тема: Обчислення коефіцієнта кореляції, побудова прямих регресій.

Зошит з курсу «Теорія ймовірності та Математичної статистики»

Практичне заняття № 15. Тема: Обчислення коефіцієнта кореляції, побудова прямих регресій.

Приклад 1. Отримано вибіркові данні про ціни на квартири та загальну їх площу в місті N, січень 2009 р.

13,8

13,8

14

22,5

24

28

32

20,9

22

21,5

32

35

24

37,9

27,5

33

40

36

60

55

80

95

70

48

53

95

75

63

112

70

- загальна площа квартири, кв.м;  - ринкова ціна квартири, тис. у.е.

Необхідно:

1.     Побудувати графік залежності між змінними, по якому необхідно підібрати модель рівняння регресії.

2.     Розрахувати параметри рівняння регресії методом найменших квадратів.

3.     Знайти коефіцієнт еластичності.

4.     Оцінити тісноту зв’язку між змінними за допомогою показників кореляції та детермінації.

Розв’язання. Графік залежності змінних Х та Y  будується у прямокутній системі координат. На осі абсцис відкладаються значення факторної ознаки Х, а по вісі ординат – результативної ознаки Y. Враховуючи невелике число пар значень змінних, по кожній з них виділимо 5 інтервалів, використовуючи формулу:

,

де h – довжина інтервалу,

хmin – найменше значення ознаки,

хmax – найбільше значення ознаки,

k – число інтервалів.

Для змінної Х:  Для інтервалу округлюється в сторону збільшення для зручного значення, =16.

В результаті отримаємо наступні границі інтервалів: 33+16=49; 49+16=65; 65+16=81; 81+16=97; 97+16=113.

Аналогічно, для змінної Y:  Границі інтервалів складають: 13; 18; 23; 28; 33; 38.

         На графік наносяться точки, координати яких відповідають значенням Y та X. Характер розташування точок на графіку показує, що зв'язок між змінними може виражатися лінійним рівнянням регресії:

.

Рис.1. Залежність  ціни на квартири від загальної їх площі

2. Параметри рівняння регресії знаходимо методом найменших квадратів, шляхом  складання та розв’язання системи нормальних рівнянь.

Для проведення усіх розрахунків будується допоміжна таблиця.

В таблиці усі середні знаходяться за формулою середньої арифметичної простої: .

Підставимо отриманні суми в систему рівнянь, враховуючи, що n=15:

Розв’язавши систему, отримуємо b0=4,7743; b1=0,3018.

Параметри рівняння регресії також можна знайти за формулами, які отримано шляхом використання правила Крамера розв’язання системи лінійних алгебраїчних рівнянь.

Допоміжна таблиця:

№ п/п

x

y

x2

y2

xy

y-

(y-2

1

33

13,8

1089

190,44

455,4

14,734

-0,934

0,873

2

40

13,8

1600

190,44

552

16,847

-3,047

9,283

3

36

14

1296

196

504

15,640

-1,640

2,688

4

60

22,5

3600

506,25

1350

22,883

-0,383

0,147

5

55

24

3025

576

1320

21,374

-2,626

6,896

6

80

28

6400

784

2240

28,919

-0,919

0,845

7

95

32

9025

1024

3040

33,447

-1,447

2,092

8

70

20,9

4900

436,81

1463

25,901

-5,001

25,012

9

48

22

2304

484

1056

19,261

2,739

7,500

10

53

21,5

2809

462,25

1139,5

20,770

0,730

0,532

11

95

32

9025

1024

3040

33,447

-1,447

2,092

12

75

35

5625

1225

2625

27,410

7,590

57,604

13

63

24

3969

576

1512

23,788

0,212

0,045

14

112

37,9

12544

1436,41

4244,8

38,577

-0,677

0,459

15

70

27,5

4900

756,25

1925

25,901

1,599

2,556

Всього

985

368,9

72111

9867,85

26466,7

368,899

-0,001

118,625

Середнє значення

65,667

24,593

4807,4

657,857

1764,447

24,593

-

7,908

 

Невеликі розбіжності в результатах розрахунків пояснюються заокругленням середніх значень в другому випадку.

Таким чином, рівняння регресії має вигляд      

Коефіцієнт регресії показує, що при збільшені загальної площі квартири на 1 м2 ціна квартири в середньому збільшиться на 0,3018 тис. У.є., або на 301,8 у.є.

Якщо в рівнянні регресії підставити фактичні значення змінної Х, то визначаються можливі (теоретичні) значення змінної , які наносяться на графік у вигляді рівняння прямої.

3.                При лінійній формі зв’язку середній коефіцієнт еластичності знаходиться за формулою Э, де  – середні значення ознак.

Э=

Коефіцієнт еластичності показує, що при збільшенні загальної площі квартири на 1% її ціна в середньому виросте на 0,806 %.

4.  При лінійній залежності, ступінь тісноти зв’язку між змінними  визначається за допомогою коефіцієнта кореляції: ,  де  та  – середні квадратичні відхилення по X та Y.

 

=0,922.

Так як значення коефіцієнта кореляції близьке до одиниці, то між ознаками зв'язок дуже тісний, пряма, близька до лінійної функціональної.

Коефіцієнт детермінації r2=0,9222=0,850  показує, що 85 % відмінностей в ціні квартир пояснюється варіацією їх загальної площі, а 15 % - іншими, неврахованими факторами (місцезнаходження квартир, благоустрій території, розвинена інфраструктура т. і.).

 

29