Числовые характеристики распределения вероятностей. Математическое ожидание, дисперсия и стандартное отклонение
п.1. Закон распределения дискретной случайной величины
При этом сумма всех вероятностей равна 1: \(\mathrm{\sum_{i=1}^n p_i=1}\)
Закон распределения можно задать таблицей, графиком или аналитически (в виде формулы).
Например:
Закон распределения случайной величины X = {0;1;2;3}, равной числу выпадения орлов при 3 бросках монеты, аналитически задаётся формулой: $$ \mathrm{ p_i=P(x_i)=P_3(i)=\frac{C_3^{i}}{2^3},\ \ i=\{0;1;2;3\} } $$
В табличном виде:
xi |
pi |
0 |
1/8 |
1 |
3/8 |
2 |
3/8 |
3 |
1/8 |
В виде графика:

п.2. Математическое ожидание
Свойства математического ожидания
1) Размерность математического ожидания равна размерности случайной величины.
2) Математическое ожидание может быть любым действительным числом: положительным, равным 0, отрицательным.
3) Математическое ожидание постоянной величины равно этой постоянной:
4) Математическое ожидание суммы независимых случайных величин равно сумме математических ожиданий:
5) Математическое ожидание произведения двух независимых случайных величин равно произведению математических ожиданий:
6) Постоянный множитель можно вынести за знак математического ожидания:
Например:
Пусть в результате экспериментов получено следующее распределение случайной величины X – числа появления белых шаров (см. пример 1, §40 данного справочника):
Число белых шаров, xi | 0 | 1 | 2 | 3 | 4 | 5 |
pi | \(\mathrm{C_5^0q^5}\) | \(\mathrm{C_5^1pq^4}\) | \(\mathrm{C_5^2p^2q^3}\) | \(\mathrm{C_5^3p^3q^2}\) | \(\mathrm{C_5^4p^4q}\) | \(\mathrm{C_5^5p^5}\) |
0,0074 | 0,0618 | 0,2060 | 0,3433 | 0,2861 | 0,0954 |
Найдём математическое ожидание для данного распределения:
п.3. Дисперсия
Свойства дисперсии
1) Размерность дисперсии равна квадрату размерности случайной величины.
2) Дисперсия может быть любым неотрицательным действительным числом.
3) Дисперсия постоянной величины равна нулю:
4) Дисперсия суммы независимых случайных величин равна сумме дисперсий:
5) Постоянный множитель можно вынести за знак дисперсии:
Например:
Продолжим исследование и найдём дисперсию для распределения случайной величины X – числа появления белых шаров. Составим расчётную таблицу:
xi
0
1
2
3
4
5
Σ
pi
0,0074
0,0618
0,2060
0,3433
0,2861
0,0954
1
xip1
0
0,0618
0,4120
1,0300
1,1444
0,4768
3,125
\(\mathrm{x_i^2}\)
0
1
4
9
16
25
–
\(\mathrm{x_i^2p_i}\)
0
0,0618
0,8240
3,0899
4,5776
2,3842
10,9375
Получаем: D(X) = 10,9375 – 3,1252 ≈ 1,1719.
п.4. Среднее квадратичное отклонение
Свойства СКО
1) Размерность СКО равна размерности случайной величины.
2) СКО может быть любым неотрицательным действительным числом.
3) СКО постоянной величины равно нулю:
4) Постоянный множитель можно вынести за знак СКО:
п.5. Правило трёх сигм
Большое количество случайных величин, измеряемых в экспериментах (например, в школьных лабораторных работах), имеет так называемое нормальное распределение.
В частности, при больших n, биномиальное распределение можно с хорошей точностью описывать как нормальное с M(X) = np и \(\mathrm{\sigma(X)=\sqrt{npq}}\).
График плотности нормального распределения p(x) похож на колокол, с максимумом, соответствующим M(X) = Xcp – среднему значению измеряемой величины.
Величина СКО σ(X) характеризует степень отклонения X от среднего значения M(X).
±σ лежит 68,26% значений, принимаемых этой величиной
±2σ лежит 95,44% значений, принимаемых этой величиной
±3σ лежит 99,72% значений, принимаемых этой величиной
Вероятность того, что нормально распределённая величина примет значение, отклоняющееся от среднего больше, чем на «три сигмы», равна 0,28%, т.е. пренебрежимо мала.
п.6. Примеры
Пример 1. Найдите математическое ожидание, дисперсию и СКО при бросании кубика.
Закон распределения величины X – очки на верхней грани при бросании кубика и расчётная таблица:
xi
1
2
3
4
5
6
Σ
pi
1/6
1/6
1/6
1/6
1/6
1/6
1
xip1
1/6
1/3
1/2
2/3
5/6
1
3,5
\(\mathrm{x_i^2}\)
1
4
9
16
25
36
–
\(\mathrm{x_i^2p_i}\)
\(\mathrm{\frac16}\)
\(\mathrm{\frac23}\)
\(\mathrm{1\frac12}\)
\(\mathrm{2\frac23}\)
\(\mathrm{4\frac16}\)
6
\(\mathrm{15\frac16}\)
Получаем: \begin{gather*} \mathrm{ M(X)=\sum_{i=1}^6 x_ip_i=3,5 }\\ \mathrm{ D(X)=\sum_{i=1}^6 x_i^2p_i-M^2(X)=15\frac16-3,5^3=2\frac{11}{12} }\\ \mathrm{ \sigma(X)=\sqrt{D(X)}=\sqrt{2\frac{11}{12}}\approx 1,7 } \end{gather*} Ответ: \(\mathrm{M(X)=3,5;\ D(X)=2\frac{11}{12};\ \sigma(X)\approx 1,7}\).
Пример 2*. Найти математическое ожидание, дисперсию и СКО суммы очков при бросании двух кубиков.
Используем свойства мат.ожиданий и дисперсий.
Пусть X – очки на первом кубике, Y – на втором.
Параметры распределения для каждого из кубиков рассчитаны в примере 1.
\(\mathrm{M(X)=M(Y)=3,5,\ \ D(X)=D(Y)=2\frac{11}{12}}\).
Для суммы очков получаем:
\(\mathrm{M(X+Y)=M(X)+M(Y)=3,5+3,5=7}\)
\(\mathrm{D(X+Y)=D(X)+D(Y)=2\frac{11}{12}+2\frac{11}{12}=5\frac56}\)
\(\mathrm{\sigma(X+Y)=\sqrt{D(X+Y)}=\sqrt{5\frac56}\approx 2,4}\)
Ответ: \(\mathrm{M(X+Y)=7;\ \ D(X+Y)=5\frac56;\ \ \sigma(X+Y)\approx 2,4}\).
Пример 3*. Докажите, что в опытах по схеме Бернулли математическое ожидание M(X)=np, а дисперсия D(X)=npq.
Проведем один опыт. В нём может быть только два исхода: «успех» и «неудача».
Составим расчётную таблицу:
xi
0
1
Σ
pi
q
p
1
xip1
0
p
p
\(\mathrm{x_i^2}\)
0
1
–
\(\mathrm{x_i^2p_i}\)
0
p
p
Мат.ожидание первого опыта \(\mathrm{M(X)=\sum x_ip_i=p}\).
Общее число успехов при n опытах складывается из числа успехов при каждом опыте, т.е. \(\mathrm{X=X_1+X_2+...+X_n}\). Все опыты между собой независимы.
По свойству мат.ожидания суммы независимых событий: \begin{gather*} \mathrm{ M(X)=M(X_1+X_2+...+X_n)=M(X_1)+M(X_2)+...+M(X_n)= }\\ \mathrm{=\underbrace{p+p+...+p}_{n\ \text{раз}}=np } \end{gather*} Дисперсия первого опыта \(\mathrm{D(X)=\sum x_i^2p_i-M(X)=p-p^2=p(1-p)=pq}\)
По свойству дисперсии суммы независимых событий: \begin{gather*} \mathrm{ D(X)=D(X_1+X_2+...+X_n)=D(X_1)+D(X_2)+...+D(X_n)= }\\ \mathrm{=\underbrace{pq+pq+...+pq}_{n\ \text{раз}}=npq } \end{gather*} Что и требовалось доказать.
Пример 4. 100 канцелярских кнопок высыпали на стул. Вероятность, что кнопка упала острием вверх, равна 0,4. Найдите среднее количество, дисперсию и СКО для числа кнопок, упавших острием вверх. Найдите интервал оценки для количества этих кнопок по правилу «трёх сигм».
По условию n = 100, p = 0,4.
Для каждой кнопки может быть два исхода: упасть острием вверх или вниз.
Таким образом, это испытание Бернулли с биномиальным распределением случайной величины. \begin{gather*} \mathrm{ M(X)=np=100\cdot 0,4=40 }\\ \mathrm{D(X)=npq=100\cdot 0,4\cdot 0,6=24 }\\ \mathrm{\sigma(X)=\sqrt{D(X)}=\sqrt{24}\approx 4,9} \end{gather*} Интервал оценки «три сигмы»: \begin{gather*} \mathrm{ M(X)-3\sigma(X)\lt X\lt M(X)+3\sigma(X) }\\ \mathrm{40-3\cdot 4,9\lt X\lt 40+3\cdot 4,9 }\\ \mathrm{25,3\lt X\lt 54,7}\\ \mathrm{26\leq X\leq 54} \end{gather*} Скорее всего (99,7%), от 26 до 54 кнопок будут острием вверх.
Ответ: \(\mathrm{M(X)=40;\ \ D(X)=24;\ \ \sigma(X)\approx 4,9;\ \ 26\leq X\leq 54}\)
Пример 5*. В тесте 10 задач с 4 вариантами ответов. Ответы выбираются наугад. Постройте распределение величины X = «количество угаданных ответов», найдите числовые характеристики этого распределения.
Найдите интервал оценки для количества угаданных ответов по правилу «трёх сигм».
Какова вероятность угадать хотя бы 1 ответ? Хотя бы 5 ответов? Угадать все 10 ответов?
По условию: \(\mathrm{n=10,\ p=\frac14,\ q=\frac34}\).
Для каждого ответа может быть два исхода: «угадал»/ «не угадал».
Таким образом, это испытание Бернулли с биномиальным распределением случайной величины. $$ \mathrm{ P_{10}(k)=C_{10}^kp^kq^{10-k}=C_{10}^k\frac{3^{10-k}}{4^{10}}=\left(\frac34\right)^{10}\frac{C_{10}^k}{3^k} } $$ Строим расчётную таблицу. Для \(\mathrm{C_{10}^k}\) используем рекуррентную формулу (см. §36 данного справочника): $$ \mathrm{ C_{n}^k=\frac{n-k+1}{k}C_n^{k-1} } $$
\(\mathrm{x_i=k}\) | \(\mathrm{C_k}\) | \(\mathrm{3^k}\) | \(\mathrm{p_i(x_i)}\) | \(\mathrm{x_i\cdot p_i}\) | \(\mathrm{x_i^2}\) | \(\mathrm{x_i^2\cdot p_i}\) |
0 | 1 | 1 | 0,0563135 | 0,0000000 | 0 | 0,0000000 |
1 | 10 | 3 | 0,1877117 | 0,1877117 | 1 | 0,1877117 |
2 | 45 | 9 | 0,2815676 | 0,5631351 | 4 | 1,1262703 |
3 | 120 | 27 | 0,2502823 | 0,7508469 | 9 | 2,2525406 |
4 | 210 | 81 | 0,1459980 | 0,5839920 | 16 | 2,3359680 |
5 | 252 | 243 | 0,0583992 | 0,2919960 | 25 | 1,4599800 |
6 | 210 | 729 | 0,0162220 | 0,0973320 | 36 | 0,5839920 |
7 | 120 | 2187 | 0,0030899 | 0,0216293 | 49 | 0,1514053 |
8 | 45 | 6561 | 0,0003862 | 0,0030899 | 64 | 0,0247192 |
9 | 10 | 19683 | 0,0000286 | 0,0002575 | 81 | 0,0023174 |
10 | 1 | 59049 | 0,0000010 | 0,0000095 | 100 | 0,0000954 |
Σ | 1 | 2,5 | 8,125 |
Получаем: \begin{gather*} \mathrm{ M(X)=\sum_{i=0}^{10} x_ip_i=2,5 }\\ \mathrm{ D(X)=\sum_{i=0}^{10} x_i^2p_i-M^2(X)=8,125=2,5^2=1,875 }\\ \mathrm{ \sigma(X)=\sqrt{D(X)}=\sqrt{1,875}\approx 1,37 } \end{gather*}
Интервал оценки «три сигмы»: \begin{gather*} \mathrm{ M(X)-3\sigma(X) \lt X\lt M(X)+3\sigma(X) }\\ \mathrm{ 2,5-3\cdot 1,37\lt X \lt 2,5+3\cdot 1,37 }\\ \mathrm{ -1,61\lt X\lt 6,61 }\\ \mathrm{ 0\leq X\leq 6 } \end{gather*} Скорее всего (по расчетам – 99,65%), вы угадаете от 0 до 6 ответов.
Вероятность угадать хотя бы один ответ: \begin{gather*} \mathrm{ P(X\geq 1)=1-p_0\approx 1-0,0563=0,9437 }\end{gather*} Очень хорошие шансы – 94,37%.
Вероятность угадать хотя бы 5 ответов: \begin{gather*} \mathrm{ P(X\geq 5)=1-\left(\sum_{i=0}^{4}{p_i} \right)\approx 1-(0,0563+0,1877+...+0,1460)=0,0781 }\end{gather*} Шансов мало – 7,81%. Т.е. «средний балл» при сдаче тестов мало достижим методом научного тыка.
Вероятность угадать все 10 ответов: p10≈ 0,000001. Шанс – один из миллиона.