Числовые характеристики распределения вероятностей. Математическое ожидание, дисперсия и стандартное отклонение

п.1. Закон распределения дискретной случайной величины

Законом распределения дискретной случайной величины называют соответствие между полученными на опыте значениями этой величины X= {xi} и их вероятностями pi = P(xi).
При этом сумма всех вероятностей равна 1: \(\mathrm{\sum_{i=1}^n p_i=1}\)
Закон распределения можно задать таблицей, графиком или аналитически (в виде формулы).

Например:
Закон распределения случайной величины X = {0;1;2;3}, равной числу выпадения орлов при 3 бросках монеты, аналитически задаётся формулой: $$ \mathrm{ p_i=P(x_i)=P_3(i)=\frac{C_3^{i}}{2^3},\ \ i=\{0;1;2;3\} } $$

В табличном виде:

xi

pi

0

1/8

1

3/8

2

3/8

3

1/8

В виде графика:

Закон распределения дискретной случайной величины

п.2. Математическое ожидание

Математическое ожидание дискретной случайной величины X = {xi} равно сумме произведений всех возможных значений xi на соответствующие вероятности pi: $$ \mathrm{ M(X)=x_1p_1+x_2p_2+...+x_{n}p_{n}=\sum_{i=1}^n x_{i}p_{i} } $$ Математическое ожидание является средним значением величины X.

Свойства математического ожидания
1) Размерность математического ожидания равна размерности случайной величины.
2) Математическое ожидание может быть любым действительным числом: положительным, равным 0, отрицательным.
3) Математическое ожидание постоянной величины равно этой постоянной:

M(C) = C

4) Математическое ожидание суммы независимых случайных величин равно сумме математических ожиданий:

M(X + Y) = M(X) + M(Y)

5) Математическое ожидание произведения двух независимых случайных величин равно произведению математических ожиданий:

M(XY) = M(X) · M(Y)

6) Постоянный множитель можно вынести за знак математического ожидания:

M(CX) = C · M(X)

Например:
Пусть в результате экспериментов получено следующее распределение случайной величины X – числа появления белых шаров (см. пример 1, §40 данного справочника):

Число белых шаров, xi 0 1 2 3 4 5
pi \(\mathrm{C_5^0q^5}\) \(\mathrm{C_5^1pq^4}\) \(\mathrm{C_5^2p^2q^3}\) \(\mathrm{C_5^3p^3q^2}\) \(\mathrm{C_5^4p^4q}\) \(\mathrm{C_5^5p^5}\)
0,0074 0,0618 0,2060 0,3433 0,2861 0,0954

Найдём математическое ожидание для данного распределения:

M(X) = 0 · 0,0074 + 1 · 0,0618 + ... + 5 · 0,0954 = 3,125

п.3. Дисперсия

Дисперсия дискретной случайной величины X = {xi} – это математическое ожидание квадрата отклонения случайной величины от её математического ожидания: $$ \mathrm{ D(X)=M(X-M(X))^2 } $$ На практике дисперсия рассчитывается по формуле: $$ \mathrm{ D(X)=M(X)^2-M^2(X)=\sum_{i=1}^n x_i^2p_i-M^2(X) } $$

Свойства дисперсии
1) Размерность дисперсии равна квадрату размерности случайной величины.
2) Дисперсия может быть любым неотрицательным действительным числом.
3) Дисперсия постоянной величины равна нулю:

D(C) = 0

4) Дисперсия суммы независимых случайных величин равна сумме дисперсий:

D(X + Y) = D(X) + D(Y)

5) Постоянный множитель можно вынести за знак дисперсии:

D(CX) = C2 · D(X)

Например:
Продолжим исследование и найдём дисперсию для распределения случайной величины X – числа появления белых шаров. Составим расчётную таблицу:

xi

0

1

2

3

4

5

Σ

pi

0,0074

0,0618

0,2060

0,3433

0,2861

0,0954

1

xip1

0

0,0618

0,4120

1,0300

1,1444

0,4768

3,125

\(\mathrm{x_i^2}\)

0

1

4

9

16

25

\(\mathrm{x_i^2p_i}\)

0

0,0618

0,8240

3,0899

4,5776

2,3842

10,9375

Получаем: D(X) = 10,9375 – 3,1252 ≈ 1,1719.

п.4. Среднее квадратичное отклонение

Среднее квадратичное отклонение (СКО) дискретной случайной величины X = {xi} – это корень квадратный от дисперсии: $$ \mathrm{ \sigma(X)=\sqrt{D(X)} } $$ СКО характеризует степень отклонения случайной величины от среднего значения.

Свойства СКО
1) Размерность СКО равна размерности случайной величины.
2) СКО может быть любым неотрицательным действительным числом.
3) СКО постоянной величины равно нулю:

σ(C) = 0

4) Постоянный множитель можно вынести за знак СКО:

σ(CX) = C · σ(X)

п.5. Правило трёх сигм

Большое количество случайных величин, измеряемых в экспериментах (например, в школьных лабораторных работах), имеет так называемое нормальное распределение.
В частности, при больших n, биномиальное распределение можно с хорошей точностью описывать как нормальное с M(X) = np и \(\mathrm{\sigma(X)=\sqrt{npq}}\).
График плотности нормального распределения p(x) похож на колокол, с максимумом, соответствующим M(X) = Xcp – среднему значению измеряемой величины.
Правило трёх сигм
Величина СКО σ(X) характеризует степень отклонения X от среднего значения M(X).

Если величина X имеет нормальное распределение, то в пределах
±σ лежит 68,26% значений, принимаемых этой величиной
±2σ лежит 95,44% значений, принимаемых этой величиной
±3σ лежит 99,72% значений, принимаемых этой величиной
Вероятность того, что нормально распределённая величина примет значение, отклоняющееся от среднего больше, чем на «три сигмы», равна 0,28%, т.е. пренебрежимо мала.

п.6. Примеры

Пример 1. Найдите математическое ожидание, дисперсию и СКО при бросании кубика.

Закон распределения величины X – очки на верхней грани при бросании кубика и расчётная таблица:

xi

1

2

3

4

5

6

Σ

pi

1/6

1/6

1/6

1/6

1/6

1/6

1

xip1

1/6

1/3

1/2

2/3

5/6

1

3,5

\(\mathrm{x_i^2}\)

1

4

9

16

25

36

\(\mathrm{x_i^2p_i}\)

\(\mathrm{\frac16}\)

\(\mathrm{\frac23}\)

\(\mathrm{1\frac12}\)

\(\mathrm{2\frac23}\)

\(\mathrm{4\frac16}\)

6

\(\mathrm{15\frac16}\)

Получаем: \begin{gather*} \mathrm{ M(X)=\sum_{i=1}^6 x_ip_i=3,5 }\\ \mathrm{ D(X)=\sum_{i=1}^6 x_i^2p_i-M^2(X)=15\frac16-3,5^3=2\frac{11}{12} }\\ \mathrm{ \sigma(X)=\sqrt{D(X)}=\sqrt{2\frac{11}{12}}\approx 1,7 } \end{gather*} Ответ: \(\mathrm{M(X)=3,5;\ D(X)=2\frac{11}{12};\ \sigma(X)\approx 1,7}\).

Пример 2*. Найти математическое ожидание, дисперсию и СКО суммы очков при бросании двух кубиков.

Используем свойства мат.ожиданий и дисперсий.
Пусть X – очки на первом кубике, Y – на втором.
Параметры распределения для каждого из кубиков рассчитаны в примере 1.
\(\mathrm{M(X)=M(Y)=3,5,\ \ D(X)=D(Y)=2\frac{11}{12}}\).
Для суммы очков получаем:
\(\mathrm{M(X+Y)=M(X)+M(Y)=3,5+3,5=7}\)
\(\mathrm{D(X+Y)=D(X)+D(Y)=2\frac{11}{12}+2\frac{11}{12}=5\frac56}\)
\(\mathrm{\sigma(X+Y)=\sqrt{D(X+Y)}=\sqrt{5\frac56}\approx 2,4}\)
Ответ: \(\mathrm{M(X+Y)=7;\ \ D(X+Y)=5\frac56;\ \ \sigma(X+Y)\approx 2,4}\).

Пример 3*. Докажите, что в опытах по схеме Бернулли математическое ожидание M(X)=np, а дисперсия D(X)=npq.

Проведем один опыт. В нём может быть только два исхода: «успех» и «неудача».
Составим расчётную таблицу:

xi

0

1

Σ

pi

q

p

1

xip1

0

p

p

\(\mathrm{x_i^2}\)

0

1

\(\mathrm{x_i^2p_i}\)

0

p

p

Мат.ожидание первого опыта \(\mathrm{M(X)=\sum x_ip_i=p}\).
Общее число успехов при n опытах складывается из числа успехов при каждом опыте, т.е. \(\mathrm{X=X_1+X_2+...+X_n}\). Все опыты между собой независимы.
По свойству мат.ожидания суммы независимых событий: \begin{gather*} \mathrm{ M(X)=M(X_1+X_2+...+X_n)=M(X_1)+M(X_2)+...+M(X_n)= }\\ \mathrm{=\underbrace{p+p+...+p}_{n\ \text{раз}}=np } \end{gather*} Дисперсия первого опыта \(\mathrm{D(X)=\sum x_i^2p_i-M(X)=p-p^2=p(1-p)=pq}\)
По свойству дисперсии суммы независимых событий: \begin{gather*} \mathrm{ D(X)=D(X_1+X_2+...+X_n)=D(X_1)+D(X_2)+...+D(X_n)= }\\ \mathrm{=\underbrace{pq+pq+...+pq}_{n\ \text{раз}}=npq } \end{gather*} Что и требовалось доказать.

Пример 4. 100 канцелярских кнопок высыпали на стул. Вероятность, что кнопка упала острием вверх, равна 0,4. Найдите среднее количество, дисперсию и СКО для числа кнопок, упавших острием вверх. Найдите интервал оценки для количества этих кнопок по правилу «трёх сигм».

По условию n = 100, p = 0,4.
Для каждой кнопки может быть два исхода: упасть острием вверх или вниз.
Таким образом, это испытание Бернулли с биномиальным распределением случайной величины. \begin{gather*} \mathrm{ M(X)=np=100\cdot 0,4=40 }\\ \mathrm{D(X)=npq=100\cdot 0,4\cdot 0,6=24 }\\ \mathrm{\sigma(X)=\sqrt{D(X)}=\sqrt{24}\approx 4,9} \end{gather*} Интервал оценки «три сигмы»: \begin{gather*} \mathrm{ M(X)-3\sigma(X)\lt X\lt M(X)+3\sigma(X) }\\ \mathrm{40-3\cdot 4,9\lt X\lt 40+3\cdot 4,9 }\\ \mathrm{25,3\lt X\lt 54,7}\\ \mathrm{26\leq X\leq 54} \end{gather*} Скорее всего (99,7%), от 26 до 54 кнопок будут острием вверх.
Ответ: \(\mathrm{M(X)=40;\ \ D(X)=24;\ \ \sigma(X)\approx 4,9;\ \ 26\leq X\leq 54}\)

Пример 5*. В тесте 10 задач с 4 вариантами ответов. Ответы выбираются наугад. Постройте распределение величины X = «количество угаданных ответов», найдите числовые характеристики этого распределения.
Найдите интервал оценки для количества угаданных ответов по правилу «трёх сигм».
Какова вероятность угадать хотя бы 1 ответ? Хотя бы 5 ответов? Угадать все 10 ответов?

По условию: \(\mathrm{n=10,\ p=\frac14,\ q=\frac34}\).
Для каждого ответа может быть два исхода: «угадал»/ «не угадал».
Таким образом, это испытание Бернулли с биномиальным распределением случайной величины. $$ \mathrm{ P_{10}(k)=C_{10}^kp^kq^{10-k}=C_{10}^k\frac{3^{10-k}}{4^{10}}=\left(\frac34\right)^{10}\frac{C_{10}^k}{3^k} } $$ Строим расчётную таблицу. Для \(\mathrm{C_{10}^k}\) используем рекуррентную формулу (см. §36 данного справочника): $$ \mathrm{ C_{n}^k=\frac{n-k+1}{k}C_n^{k-1} } $$

\(\mathrm{x_i=k}\) \(\mathrm{C_k}\) \(\mathrm{3^k}\) \(\mathrm{p_i(x_i)}\) \(\mathrm{x_i\cdot p_i}\) \(\mathrm{x_i^2}\) \(\mathrm{x_i^2\cdot p_i}\)
0 1 1 0,0563135 0,0000000 0 0,0000000
1 10 3 0,1877117 0,1877117 1 0,1877117
2 45 9 0,2815676 0,5631351 4 1,1262703
3 120 27 0,2502823 0,7508469 9 2,2525406
4 210 81 0,1459980 0,5839920 16 2,3359680
5 252 243 0,0583992 0,2919960 25 1,4599800
6 210 729 0,0162220 0,0973320 36 0,5839920
7 120 2187 0,0030899 0,0216293 49 0,1514053
8 45 6561 0,0003862 0,0030899 64 0,0247192
9 10 19683 0,0000286 0,0002575 81 0,0023174
10 1 59049 0,0000010 0,0000095 100 0,0000954
Σ 1 2,5 8,125

Получаем: \begin{gather*} \mathrm{ M(X)=\sum_{i=0}^{10} x_ip_i=2,5 }\\ \mathrm{ D(X)=\sum_{i=0}^{10} x_i^2p_i-M^2(X)=8,125=2,5^2=1,875 }\\ \mathrm{ \sigma(X)=\sqrt{D(X)}=\sqrt{1,875}\approx 1,37 } \end{gather*} Пример 5
Интервал оценки «три сигмы»: \begin{gather*} \mathrm{ M(X)-3\sigma(X) \lt X\lt M(X)+3\sigma(X) }\\ \mathrm{ 2,5-3\cdot 1,37\lt X \lt 2,5+3\cdot 1,37 }\\ \mathrm{ -1,61\lt X\lt 6,61 }\\ \mathrm{ 0\leq X\leq 6 } \end{gather*} Скорее всего (по расчетам – 99,65%), вы угадаете от 0 до 6 ответов.

Вероятность угадать хотя бы один ответ: \begin{gather*} \mathrm{ P(X\geq 1)=1-p_0\approx 1-0,0563=0,9437 }\end{gather*} Очень хорошие шансы – 94,37%.
Вероятность угадать хотя бы 5 ответов: \begin{gather*} \mathrm{ P(X\geq 5)=1-\left(\sum_{i=0}^{4}{p_i} \right)\approx 1-(0,0563+0,1877+...+0,1460)=0,0781 }\end{gather*} Шансов мало – 7,81%. Т.е. «средний балл» при сдаче тестов мало достижим методом научного тыка.
Вероятность угадать все 10 ответов: p10≈ 0,000001. Шанс – один из миллиона.

Регистрация
Войти с помощью
Необходимо принять пользовательское соглашение
Войти
Войти с помощью
Восстановление пароля
Пожаловаться
Задать вопрос