Дискретные распределения вероятностей и их параметры
п.1. Общие свойства дискретного распределения
Случайная величина называется дискретной, если она принимает не более чем счетное количество значений.
Дискретная случайная величина называется конечной, если она принимает конечное число значений.
Согласно данному определению дискретная величина может быть определена либо на бесконечном счетном множестве, либо на конечном множестве (которое всегда счетное).
Напомним, что счетным называется множество, которое эквивалентно множеству натуральных чисел, т.е. элементы которого можно пронумеровать (см. §11 справочника для 8 класса).
Например:
1) При подбрасывании игрального кубика мы получаем всего 6 исходов. Случайная величина X – выпавшее число очков – принимает конечное число значений \(\Omega=\left\{1;2;3;4;5;6\right\}\), т.е. является дискретной конечной случайной величиной.
2) Случайная величина X – количество поступивших вызовов на сервер за сутки – не ограничена сверху и может принимать значения \(\Omega=\left\{1;2;3;...\right\}\)
Случайная величина полностью описывается своим законом распределения.
Закон распределения может быть задан аналитически (формулой), таблично или графически.
Например:
В результате измерения температуры учеников школы получен следующий ряд распределения:
t, °C | 36,3 | 36,4 | 36,5 | 36,6 | 36,7 | 36,8 | 36,9 | 37,0 | 37,1 |
p(t) | 0,05 | 0,07 | 0,15 | 0,33 | 0,31 | 0,11 | 0,04 | 0,01 | 0,01 |
Чтобы вспомнить о несовместных событиях и полной группе событий – см. §39 справочника для 9 класса.
Например:
Пусть в урне находится 2 белых и 3 черных шара. Мы достаем шар, смотрим на его цвет, возвращаем его обратно и все шары перемешиваем. Таким образом, событие A=«достали белый шар» каждый раз является независимым от предыдущих и имеет вероятность \(p=\frac25\).
Пусть мы провели n=3 испытания. В 3 испытаниях можно получить от 0 до 3 белых шаров. Вероятность событий \(k\in\left\{0;1;2;3\right\}\) описывается биномиальным законом распределения (см. §40 справочника для 9 класса): $$ P_3(k)=C_3^k p^k q^{3-q},\ \ k=\overline{0;3} $$ Получаем закон распределения: \begin{gather*} P_3(0)=C_3^0 p^0 q^{3-0}=q^3=\left(\frac35\right)^3=\frac{27}{125}\\ P_3(1)=C_3^1 p^1 q^{3-1}=3pq^2=3\cdot \frac25\cdot \left(\frac35\right)^2=\frac{54}{125}\\ P_3(2)=C_3^2 p^2 q^{3-2}=3p^2q=3\cdot \left(\frac25\right)^2\cdot \frac35=\frac{36}{125}\\ P_3(3)=C_3^3 p^3 q^{3-3}=p^3=\left(\frac25\right)^3=\frac{8}{125} \end{gather*}
k | 0 | 1 | 2 | 3 |
\(P_3(k)\) | \(\frac{27}{125}\) | \(\frac{54}{125}\) | \(\frac{36}{125}\) | \(\frac{8}{125}\) |
Сумма вероятностей: $$ \sum_{k=0}^3 P(k)=\frac{27+54+36+8}{125}=1 $$
п.2. Функция распределения дискретной случайной величины
Для дискретной случайной величины функция распределения будет ступенчатой кусочно-непрерывной функцией, область значений которой: \(F(x)\in[0;1]\).
Слева на графике функции распределения будет нулевая «ступенька», а справа – единичная «ступенька».
Например:
Найдем из закона распределения случайной величины k, полученного в предыдущем примере для урны с шарами, функцию распределения.
k | 0 | 1 | 2 | 3 |
\(P_3(k)\) | \(\frac{27}{125}\) | \(\frac{54}{125}\) | \(\frac{36}{125}\) | \(\frac{8}{125}\) |
\(F(k)\) | \(\frac{27}{125}\) | \(\frac{27+54}{125}=\frac{81}{125}\) | \(\frac{81+36}{125}=\frac{117}{125}\) | \(\frac{117+8}{125}=1\) |
Изобразим графически закон распределения в виде гистограммы:
Построим график для функции распределения: \begin{gather*} F(k)= \begin{cases} 0,\ k\leq 0\\ \frac{27}{125},\ 0\lt k\leq 1\\ \frac{81}{125},\ 1\lt k\lt 2\\ \frac{117}{125},\ 2\lt k\leq 3\\ 1,\ k\gt 3 \end{cases} \end{gather*}
п.3. Числовые характеристики дискретного распределения
Числовыми характеристиками дискретного распределения являются математическое ожидание, дисперсия и среднее квадратичное отклонение (СКО).
Подробно о свойствах этих характеристик – см. §41 справочника для 9 класса.
Здесь мы приведем только основные определения.
Например:
Рассчитаем числовые характеристики для урны с шарами из предыдущего примера.
Составим расчетную таблицу:
\(x_i\) | 0 | 1 | 2 | 3 | ∑ |
\(p_i\) | \(\frac{27}{125}\) | \(\frac{54}{125}\) | \(\frac{36}{125}\) | \(\frac{8}{125}\) | \(1\) |
\(x_i p_i\) | \(0\) | \(\frac{54}{125}\) | \(\frac{72}{125}\) | \(\frac{24}{125}\) | \(1,2\) |
\(x_i^2\) | 0 | 1 | 4 | 9 | - |
\(x_i^2 p_i\) | \(0\) | \(\frac{54}{125}\) | \(\frac{144}{125}\) | \(\frac{72}{125}\) | \(2,16\) |
Получаем \begin{gather*} M(X)=\sum_{i=0}^3 x_i p_i=1,2=\frac65\\ D(X)=\sum_{i=0}^3 x_i^2 p_i-M^2(X)=2,16-1,2^2=0,72=\frac{18}{25}\\ \sigma(X)=\sqrt{D(X)}=\sqrt{\frac{18}{25}}=\frac{3\sqrt{2}}{5} \end{gather*} В научных статьях и технической документации принято записывать случайные величины в виде \(x=M(X)\pm\sigma (X)\).
В данном случае для числа вынутых белых шаров в 3 испытаниях можем записать: $$ k=\frac{6\pm 3\sqrt{2}}{5} $$
п.4. Таблица дискретных распределений и их параметров
Название | Принятое обозначение |
Плотность распределения |
Мат. ожидание |
Дисперсия |
Дискретное равномерное | \(U(N)\) | \begin{gather*} P(\left\{k\right\})=\frac1N\\ N\in\mathbb{N},\ k\in\left\{1,...,N\right\} \end{gather*} | \(\frac{N+1}{2}\) | \(\frac{N^2-1}{12}\) |
Бернулли | \(B(1,p)\) | \begin{gather*} P(0)=1-p=q\\ P(1)=p\\ k\in\left\{0;1\right\} \end{gather*} | \(p\) | \(pq\) |
Биномиальное | \(B(n,p)\) | \begin{gather*} P(\left\{k\right\})=C_n^k p^k q^{n-k}\\ n\in\mathbb{N},\ k=\in\left\{0,1,...,n\right\} \end{gather*} | \(np\) | \(npq\) |
Пуассона | \(Pois(\lambda)\) | \begin{gather*} P(\left\{k\right\})=\frac{\lambda^k}{k!}e^{-\lambda}\\ \lambda\gt 0,\ k=\in\left\{0,1,...,n\right\} \end{gather*} | \(\lambda\) | \(\lambda\) |
Геометрическое | \(Geopm(p)\) | \begin{gather*} P(\left\{k\right\})=pq^{k-1}\\ k=\in\left\{0,1,2,...\right\} \end{gather*} | \(\frac1p\) | \(\frac{q}{p^2}\) |
Гипер-геометрическое | \(HG(D,N,n)\) | \begin{gather*} P(\left\{k\right\})=\frac{C_D^k C_{N_D}^{n-k}}{C_N^n} \end{gather*} | \(\frac{nD}{N}\) | $$\frac{\frac{nD}{N}\left(1-\frac DN\right)(N-n)}{N-1}$$ |
п.5. Примеры
Пример 1. Выведите формулы для мат.ожидания и дисперсии дискретного равномерного распределения
Предварительно заметим, что по формуле суммы арифметической прогрессии: $$ \sum_{i=1}^N k_i=1+2+...+N=\frac{N(N+1)}{2} $$ А сумму квадратов можно найти по формуле Архимеда (доказательство – см. пример 2 в §25 справочника для 9 класса): $$ \sum_{i=1}^N k_i^2=1^2+2^2+...+N^2=\frac{N(N+1)(2N+1)}{6} $$ Найдем математическое ожидание: $$ M(X)=\sum_{i=1}^N k_ip_i=\sum_{i=1}^N k_i\cdot \frac1N=\frac1N(1+2+...+N)=\frac1N\cdot\frac{N(N+1)}{2}=\frac{N+1}{2} $$ Найдем дисперсию: \begin{gather*} D(X)=\sum_{i=1}^N k_i^2 p_i-M^2(X)=\sum_{i=1}^N k_i^2\cdot\frac1N-M^2(X)=\\ =\frac1N\cdot\frac{N(N+1)(2N_1)}{6}-\left(\frac{N+1}{2}\right)^2=\frac{(N+1)(2N+1)}{6}-\frac{(N+1)^2}{4}=\\ =\frac{N+1}{2}\left(\frac{2N+1}{3}-\frac{N+1}{2}\right)=\frac{N+1}{2}\cdot\frac{4N+2-3N-3}{6}=\frac{N+1}{2}\cdot\frac{N-1}{6}=\frac{N^2-1}{12} \end{gather*} В частности, для игрального кубика: $$ N=6;\ p_i=\frac16;\ M(X)=\frac{6+1}{2}=3,5;\ D(X)=\frac{6^2-1}{12}=2\frac{11}{12} $$
Ответ: \(M(X)=\frac{N+1}{2};\ D(X)=\frac{N^2-1}{12}\)
Пример 2. Выведите формулы для мат.ожидания и дисперсии распределения Бернулли.
Закон распределения:
\(k_i\) | 0 | 1 |
\(p_i\) | 1-p | p |
Найдем математическое ожидание: $$ M(X)=0\cdot (1-p)+1\cdot p=p $$ Найдем дисперсию: \begin{gather*} D(X)=(0^2\cdot(1-p)+1^2\cdot p)-M^2(X)=p-p^2=p(1-p)=pq \end{gather*}
Типичным примером является бросание монеты, где \(M(X)=p=0,5\) и \(D(X)=0,5\cdot 0,5=0,25\). Дисперсия максимальна для нефальшивой монеты.
Рассмотрим другой пример – бросание фальшивой монеты, для которой вероятность выпадения орла (k=1) равна p=0,7. Тогда \(M(k)=p=0,7\), дисперсия \(D(k)=0,7\cdot 0,3=0,21\). Как и ожидалось, для фальшивой монеты средняя величина возрастает (70% бросков заканчивается выпадением орла). При этом дисперсия уменьшается.
Ответ: \(M(X)=p,\ D(X)=pq\)
Пример 3. Выведите формулы для мат.ожидания и дисперсии биномиального распределения.
При этом вероятность успеха в каждом испытании постоянна и равна \(p\in(0;1)\).
Вероятность неудачи в каждом испытании \(q=1-p\).
Вероятность того, что событие A появится в n испытаниях Бернулли ровно k раз, выражается биномиальным распределением: $$ P_n(k)=C_n^k p^k q^{n-k} $$
Математическое ожидание и дисперсию для одного опыта Бернулли мы получили в примере 2: \(M(X)=p,\ D(X)=pq\).
Общее число успехов при n опытах складывается из числа успехов при каждом опыте, т.е. \(X=X_1+X_2+...+X_n\). Все опыты между собой независимы.
По свойству мат.ожидания суммы независимых событий (см. §41 справочника для 9 класса): \begin{gather*} M(X)=M(X_1+X_2+...+X_n)=M(X_1)+M(X_2)+...+M(X_n)=\\ =\underbrace{p+p+...+p}_{n\ раз}=np \end{gather*} По свойству дисперсии суммы независимых событий (см. §41 справочника для 9 класса): \begin{gather*} D(X)=D(X_1+X_2+...+X_n)=D(X_1)+D(X_2)+...+D(X_n)=\\ =\underbrace{pq+pq+...+pq}_{n\ раз}=npq \end{gather*} Например, пусть событие A=«уронить молоток на ногу» имеет вероятность p=0,1.
Тогда для n=100 забиваний гвоздей вы в среднем уроните молоток на ногу
\(M(X)=np=100\cdot 0,1=10\) раз
Дисперсия этого события \(D(X)=npq=100\cdot 0,1\cdot 0,9=9\)
СКО \(\sigma(X)=\sqrt{D(X)}=3\)
По правилу «трех сигм» интервал оценки: \begin{gather*} 10-3\cdot 3\lt X\lt 10+3\cdot 3\\ -17\lt X\lt 37\\ 0\leq X\leq 36 \end{gather*} Скорее всего (вероятность 99,72%), вы уроните молоток от 0 до 36 раз.
Ответ: \(M(X)=np,\ D(X)=npq\)
Пример 4. Выведите формулы для мат.ожидания и дисперсии распределения Пуассона.
Распределение Пуассона получается из биномиального распределения предельным переходом \(n\rightarrow\infty,\ p\rightarrow 0,\ np\rightarrow\lambda\).
Найдем математическое ожидание как предел мат. ожидания биномиального распределения: $$ M(X)=\lim_{np\rightarrow\lambda}M_B(X)=\lim_{np\rightarrow\lambda}(np)=\lambda $$ Т.е. параметр \(\lambda\) является средним числом удачных исходов.
Дисперсия, если учесть что \(p\rightarrow 0\), а значит \(q=1-p\rightarrow 1\) $$ D(X)=\underset{q\rightarrow 1}{\lim_{np\rightarrow\lambda}} D_B(X)=\underset{q\rightarrow 1}{\lim_{np\rightarrow\lambda}}(npq)=\lambda\cdot 1=\lambda $$
Например, в городе размерами 10х10 км болеет гриппом 1000 человек.
С какой вероятностью в комнате размерами 10х10 м:
а) не окажется больных;
б) окажется 1 больной?
Площадь города в метрах \(S=(10^4)^2=10^8\) м2
Площадь комнаты в метрах \(s_0=10^2\) м2
Среднее количество больных в комнате: \(\lambda=N\frac{s_0}{S}=10^3\cdot\frac{10^2}{10^3}=10^{-3}=0,001\)
а) вероятность того, что в комнате не окажется больных: $$ p_0=\frac{0,001^0}{0!}e^{-0,001}=e^{-0,001}\approx 1-0,001=0,999 $$ Здесь мы использовали формулу приближенных вычислений \(e^x\approx 1+x,\ x\rightarrow 0\) (см. §52 данного справочника).
б) вероятность того, что в комнате окажется один больной: $$ p_1=\frac{0,001^1}{1!}e^{-0,001}=0,000999\approx 0,001 $$ Вероятность всех остальных случаев пренебрежимо мала.
Таким образом, при малых \(\lambda\) вероятности \(p_0\approx 1-\lambda,\ p_1\approx\lambda\), т.е. фактически мы получаем распределение Бернулли.
Ответ: \(M(X)=\lambda ,\ D(X)=\lambda\)