Теорія ймовірностей та математична статистика

Лекція 12. Вивчення зв'язку між випадковими величинами за допомогою прямих регресії

Якщо ρ(X,Y)≠0, то Х і Y – корельовані випадкові величини і з наближенням величини |ρ(X,Y)| до одиниці залежність між цими випадковими величинами наближається до лінійної залежності вигляду Y=αX+β. Тому цілком природним є питання про наближене зображення зв'язку між Х і Y у вигляді лінійної функції.

Означення. Пряма y=αx+β називається прямою регресії (або прямою середньої квадратичної регресії) Y на Х, якщо коефіцієнти α, β вибрані так, що середнє квадратичне відхилення αX+β від Y є мінімальним: E(Y-αX-β)²=min.

Щоб знайти значення α, β, про які сказано в означенні, здійснимо перетворення величини E(Y-αX-β)²=min, яку нам треба мінімізувати:

оскільки

Отже,

Тепер видно, що величина набуватиме найменшого значення тоді і лише тоді, коли виконуватимуться рівності:

звідки можна визначити відповідні значення сталих α, β:

Отже, рівняння прямої регресії Y на Х має вигляд:

або

Приклад.

Монету кинули двічі. Нехай Х – кількість випадань герба, Y – кількість випадань цифри. Записати рівняння прямої регресії Y на Х.

Розв'язання. Маємо: кількість випробувань n=2, ймовірність випадання герба в одному випробуванні p=0,5, цифри q =0,5. Тоді E(X)=np=1, E(Y)=nq=1, D(X)=D(Y)=npq=0,5.

Закон розподілу випадкової величини XY задається таблицею

ХY=k	0	1
P{XY=k}	0,5	0,5

Отже,

і рівняння прямої регресії Y на Х запишеться у вигляді y=2-x.

Початкові і центральні моменти випадкових величин. Асиметрія та ексцес

Математичне сподівання і дисперсія характеризують найважливіші параметри розподілу випадкових величин: середнє значення та ступінь розсіювання можливих значень величини навколо середнього значення. Крім цих характеристик, у теорії ймовірностей застосовуються деякі інші числові характеристики відповідного призначення, кожна з яких характеризує випадкову величину з позиції тих чи інших особливостей її розподілу. Серед них особливе значення мають початкові і центральні моменти, а також асиметрія та ексцес.

Означення. Початковим моментом k-го порядку випадкової величини Х називають математичне сподівання величини X^k і позначають v_k:

v_k=E(X^k).

Зокрема, v₁=E(X), v₂=E(X²), і для обчислення дисперсії маємо таку формулу: D(X)=v₂-v₁².

Означення. Центральним моментом k-го порядку випадкової величини Х називають математичне сподівання величини (X-E(X))^kі позначають µ_k:

µ_k=E(X-E(X))^k.

Зокрема,

Між центральними і початковими моментами існує зв'язок:

Для дискретної випадкової величини Х, яка набуває значень x_i з імовірностями, p_i,

Для неперервної випадкової величини Х зі щільністю розподілу p(x)

Означення. Асиметрією випадкової величини Х називається число А, яке обчислюється за формулою:

З цієї формули випливає, що напрям асиметрії випадкової величини визначається за допомогою центрального моменту µ₃, який має розмірність куба випадкової величини. Якщо µ₃=0 то випадкова величина розподілена симетрично відносно математичного сподівання E(X). Коли µ₃‹0(µ₃›0)то розподіл випадкової величини Х має від'ємну (додатну) асиметрію. Коефіцієнт асиметрії А є безрозмірною величиною. Його використовують для оцінки як напрямку, так і сили асиметрії розподілу випадкової величини.

Означення. Ексцесом випадкової величини Х називається число E_S, яке визначається рівністю:

Ексцес E_S, як і коефіцієнт асиметрії А, є безрозмірною величиною. Він характеризує "гостровершинність" графіка щільності розподілу розглядуваної випадкової величини у порівнянні з кривою нормального розподілу

Для нормального розподілу ексцес E_S=0; криві, які є більш гостровершинні, порівнюючи з нормальною, мають ексцес E_S>0, менш гостровершинні – ексцес E_S‹0.

Лекція 12. Вивчення зв'язку між випадковими величинами за допомогою прямих регресії

оскільки

Отже,

Тепер видно, що величина набуватиме найменшого значення тоді і лише тоді, коли виконуватимуться рівності:

звідки можна визначити відповідні значення сталих α, β:

Отже, рівняння прямої регресії Y на Х має вигляд:

або

Приклад.

Закон розподілу випадкової величини XY задається таблицею

ХY=k	0	1
P{XY=k}	0,5	0,5

Отже,

і рівняння прямої регресії Y на Х запишеться у вигляді y=2-x.

Початкові і центральні моменти випадкових величин. Асиметрія та ексцес

v_k=E(X^k).

Зокрема, v₁=E(X), v₂=E(X²), і для обчислення дисперсії маємо таку формулу: D(X)=v₂-v₁².

µ_k=E(X-E(X))^k.

Зокрема,

Між центральними і початковими моментами існує зв'язок:

Для дискретної випадкової величини Х, яка набуває значень x_i з імовірностями, p_i,

Для неперервної випадкової величини Х зі щільністю розподілу p(x)

Означення. Асиметрією випадкової величини Х називається число А, яке обчислюється за формулою:

Означення. Ексцесом випадкової величини Х називається число E_S, яке визначається рівністю: