Равномерно распределенная случайная величина. Математика и информатика

Как было сказано ранее, примерами распределений вероятностей непрерывной случайной величины Х являются:

  • равномерное распределение вероятностей непрерывной случайной величины;
  • показательное распределение вероятностей непрерывной случайной величины;
  • нормальное распределение вероятностей непрерывной случайной величины.

Дадим понятие равномерного и показательного законов распределения, формулы вероятности и числовые характеристики рассматриваемых функций.

Показатель Раномерный закон распределения Показательный закон распределения
Определение Равномерным называется распределение вероятностей непрерывной случайной величины X, плотность которого сохраняет постоянное значение на отрезке и имеет вид Показательным (экспоненциальным) называется распределение вероятностей непрерывной случайной величины X, которое описывается плотностью, имеющей вид

где λ – постоянная положительная величина
Функция распределения
Вероятность попадания в интервал
Математическое ожидание
Дисперсия
Среднее квадратическое отклонение

Примеры решения задач по теме «Равномерный и показательный законы распределения»

Задача 1.

Автобусы идут строго по расписанию. Интервал движения 7 мин. Найти: а) вероятность того, что пассажир, подошедший к остановке, будет ожидать очередной автобус менее двух минут; б) вероятность того, что пассажир, подошедший к остановке, будет ожидать очередной автобус не менее трех минут; в) математическое ожидание и среднее квадратическое отклонение случайной величины X – времени ожидания пассажира.

Решение. 1. По условию задачи непрерывная случайная величина X={время ожидания пассажира} равномерно распределена между приходами двух автобусов. Длина интервала распределения случайной величины Х равна b-a=7, где a=0, b=7.

2. Время ожидания будет менее двух минут, если случайная величина X попадает в интервал (5;7). Вероятность попадания в заданный интервал найдем по формуле: Р(х 1 <Х<х 2)=(х 2 -х 1)/(b-a) .
Р(5 < Х < 7) = (7-5)/(7-0) = 2/7 ≈ 0,286.

3. Время ожидания будет не менее трех минут (т.е. от трех до семи мин.), если случайная величина Х попадает в интервал (0;4). Вероятность попадания в заданный интервал найдем по формуле: Р(х 1 <Х<х 2)=(х 2 -х 1)/(b-a) .
Р(0 < Х < 4) = (4-0)/(7-0) = 4/7 ≈ 0,571.

4. Математическое ожидание непрерывной, равномерно распределенной случайной величины X – времени ожидания пассажира, найдем по формуле: М(Х)=(a+b)/2 . М(Х) = (0+7)/2 = 7/2 = 3,5.

5. Среднее квадратическое отклонение непрерывной, равномерно распределенной случайной величины X – времени ожидания пассажира, найдем по формуле: σ(X)=√D=(b-a)/2√3 . σ(X)=(7-0)/2√3=7/2√3≈2,02.

Задача 2.

Показательное распределение задано при x ≥ 0 плотностью f(x) = 5e – 5x. Требуется: а) записать выражение для функции распределения; б) найти вероятность того, что в результате испытания X попадает в интервал (1;4); в) найти вероятность того, что в результате испытания X ≥ 2 ; г) вычислить M(X), D(X), σ(X).

Решение. 1. Поскольку по условию задано показательное распределение , то из формулы плотности распределения вероятностей случайной величины X получаем λ = 5. Тогда функция распределения будет иметь вид:

2. Вероятность того, что в результате испытания X попадает в интервал (1;4) будем находить по формуле:
P(a < X < b) = e −λa − e −λb .
P(1 < X < 4) = e −5*1 − e −5*4 = e −5 − e −20 .

3. Вероятность того, что в результате испытания X ≥ 2 будем находить по формуле: P(a < X < b) = e −λa − e −λb при a=2, b=∞.
Р(Х≥2) = P(1< X < 4) = e −λ*2 − e −λ*∞ = e −2λ − e −∞ = e −2λ - 0 = e −10 (т.к. предел e −х при х стремящемся к ∞ равен нулю).

4. Находим для показательного распределения:

  • математическое ожидание по формуле M(X) =1/λ = 1/5 = 0,2;
  • дисперсию по формуле D(X) = 1/ λ 2 = 1/25 = 0,04;
  • среднее квадратическое отклонение по формуле σ(Х) = 1/λ = 1/5 = 1,2.

В качестве примера непрерывной случайной величины рассмотрим случайную величину X, равномерно распределенную на интервале (a; b). Говорят, что случайная величина X равномерно распределена на промежутке (a; b), если ее плотность распределения непостоянна на этом промежутке:

Из условия нормировки определим значение константы c . Площадь под кривой плотности распределения должна быть равна единице, но в нашем случае - это площадь прямоугольника с основанием (b - α) и высотой c (рис. 1).

Рис. 1 Плотность равномерного распределения
Отсюда находим значение постоянной c:

Итак, плотность равномерно распределенной случайной величины равна

Найдем теперь функцию распределения по формуле:
1) для
2) для
3) для 0+1+0=1.
Таким образом,

Функция распределения непрерывна и не убывает (рис. 2).

Рис. 2 Функция распределения равномерно распределенной случайной величины

Найдем математическое ожидание равномерно распределенной случайной величины по формуле:

Дисперсия равномерного распределения рассчитывается по формуле и равна

Пример №1 . Цена деления шкалы измерительного прибора равна 0.2 . Показания прибора округляют до ближайшего целого деления. Найти вероятность того, что при отсчете будет сделана ошибка: а) меньшая 0.04 ; б) большая 0.02
Решение. Ошибка округления есть случайная величина, равномерно распределенная на промежутке между соседними целыми делениями. Рассмотрим в качестве такого деления интервал (0; 0,2) (рис. а). Округление может проводиться как в сторону левой границы - 0, так и в сторону правой - 0,2, значит, ошибка, менее либо равная 0,04, может быть сделана два раза, что необходимо учесть при подсчете вероятности:



P = 0,2 + 0,2 = 0,4

Для второго случая величина ошибки может превышать 0,02 также с обеих границ деления, то есть она может быть либо больше 0,02, либо меньше 0,18.


Тогда вероятность появления такой ошибки:

Пример №2 . Предполагалось, что о стабильности экономической обстановки в стране (отсутствии войн, стихийных бедствий и т. д.) за последние 50 лет можно судить по характеру распределения населения по возрасту: при спокойной обстановке оно должно быть равномерным . В результате проведенного исследования, для одной из стран были получены следующие данные.

Имеются ли основания полагать, что в стране была нестабильная обстановка?

Решение проводим с помощью калькулятора Проверка гипотез . Таблица для расчета показателей.

Группы Середина интервала, x i Кол-во, f i x i * f i Накопленная частота, S |x - x ср |*f (x - x ср) 2 *f Частота, f i /n
0 - 10 5 0.14 0.7 0.14 5.32 202.16 0.14
10 - 20 15 0.09 1.35 0.23 2.52 70.56 0.09
20 - 30 25 0.1 2.5 0.33 1.8 32.4 0.1
30 - 40 35 0.08 2.8 0.41 0.64 5.12 0.08
40 - 50 45 0.16 7.2 0.57 0.32 0.64 0.16
50 - 60 55 0.13 7.15 0.7 1.56 18.72 0.13
60 - 70 65 0.12 7.8 0.82 2.64 58.08 0.12
70 - 80 75 0.18 13.5 1 5.76 184.32 0.18
1 43 20.56 572 1
Показатели центра распределения .
Средняя взвешенная


Показатели вариации .
Абсолютные показатели вариации .
Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.
R = X max - X min
R = 70 - 0 = 70
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).


Среднее квадратическое отклонение .

Каждое значение ряда отличается от среднего значения 43 не более, чем на 23.92
Проверка гипотез о виде распределения .
4. Проверка гипотезы о равномерном распределении генеральной совокупности.
Для того чтобы проверить гипотезу о равномерном распределении X,т.е. по закону: f(x) = 1/(b-a) в интервале (a,b)
надо:
1. Оценить параметры a и b - концы интервала, в котором наблюдались возможные значения X, по формулам (через знак * обозначены оценки параметров):

2. Найти плотность вероятности предполагаемого распределения f(x) = 1/(b * - a *)
3. Найти теоретические частоты:
n 1 = nP 1 = n = n*1/(b * - a *)*(x 1 - a *)
n 2 = n 3 = ... = n s-1 = n*1/(b * - a *)*(x i - x i-1)
n s = n*1/(b * - a *)*(b * - x s-1)
4. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы k = s-3, где s - число первоначальных интервалов выборки; если же было произведено объединение малочисленных частот, следовательно, и самих интервалов, то s - число интервалов, оставшихся после объединения.

Решение:
1. Найдем оценки параметров a * и b * равномерного распределения по формулам:


2. Найдем плотность предполагаемого равномерного распределения:
f(x) = 1/(b * - a *) = 1/(84.42 - 1.58) = 0.0121
3. Найдем теоретические частоты:
n 1 = n*f(x)(x 1 - a *) = 1 * 0.0121(10-1.58) = 0.1
n 8 = n*f(x)(b * - x 7) = 1 * 0.0121(84.42-70) = 0.17
Остальные n s будут равны:
n s = n*f(x)(x i - x i-1)

i n i n * i n i - n * i (n i - n* i) 2 (n i - n * i) 2 /n * i
1 0.14 0.1 0.0383 0.00147 0.0144
2 0.09 0.12 -0.0307 0.000943 0.00781
3 0.1 0.12 -0.0207 0.000429 0.00355
4 0.08 0.12 -0.0407 0.00166 0.0137
5 0.16 0.12 0.0393 0.00154 0.0128
6 0.13 0.12 0.0093 8.6E-5 0.000716
7 0.12 0.12 -0.000701 0 4.0E-6
8 0.18 0.17 0.00589 3.5E-5 0.000199
Итого 1 0.0532
Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение K набл, тем сильнее довод против основной гипотезы.
Поэтому критическая область для этой статистики всегда правосторонняя: , если плотность ее вероятности постоянна на этом отрезке, а вне его равна 0 (т.е. случайная величина Х сосредоточена на отрезке [a , b ], на котором имеет постоянную плотность). По данному определению плотность равномерно распределенной на отрезке [a , b ] случайной величины Х имеет вид:

где с есть некоторое число. Впрочем, его легко найти, используя свойство плотности вероятности для с.в., сосредоточенных на отрезке [a , b ]:
. Отсюда следует, что
, откуда
. Поэтомуплотность равномерно распределенной на отрезке [a , b ] случайной величины Х имеет вид:

.

Судить о равномерности распределения н.с.в. Х можно из следующего соображения. Непрерывная случайная величина имеет равномерное распределение на отрезке [a , b ], если она принимает значения только из этого отрезка, и любое число из этого отрезка не имеет преимущества перед другими числами этого отрезка в смысле возможности быть значением этой случайной величины.

К случайным величинам, имеющим равномерное распределение относятся такие величины, как время ожидания транспорта на остановке (при постоянном интервале движения длительность ожидания равномерно распределена на этом интервале), ошибка округления числа до целого (равномерно распределена на [−0.5, 0.5 ]) и другие.

Вид функции распределения F (x ) a , b ] случайной величины Х ищется по известной плотности вероятности f (x ) c помощью формулы их связи
. В результате соответствующих вычислений получаем следующую формулу для функции распределенияF (x ) равномерно распределенной отрезке [a , b ] случайной величины Х :

.

На рисунках приведены графики плотности вероятности f (x ) и функции распределения f (x ) равномерно распределенной отрезке [a , b ] случайной величины Х :


Математическое ожидание, дисперсия, среднее квадратическое отклонение, мода и медиана равномерно распределенной отрезке [a , b ] случайной величины Х вычисляются по плотности вероятности f (x ) обычным образом (и достаточно просто из-за простого вида f (x ) ). В результате получаются следующие формулы:

а модой d (X ) является любое число отрезка [a , b ].

Найдем вероятность попадания равномерно распределенной отрезке [a , b ] случайной величины Х в интервал
, полностью лежащий внутри [a , b ]. Учитывая известный вид функции распределения, получаем:

Таким образом, вероятность попадания равномерно распределенной отрезке [a , b ] случайной величины Х в интервал
, полностью лежащий внутри [a , b ], не зависит от положения этого интервала, а зависит только от его длины и прямо пропорциональна этой длине.

Пример . Интервал движения автобуса составляет 10 минут. Какова вероятность того, что пассажир, подошедший к остановке, прождет автобус менее 3 минут? Каково среднее время ожидания автобуса?

Нормальное распределение

Это распределение наиболее часто встречается на практике и играет исключительную роль в теории вероятностей и математической статистике и их приложениях, поскольку такое распределение имеют очень многие случайные величины в естествознании, экономике, психологии, социологии, военных науках и так далее. Данное распределение является предельным законом, к которому приближаются (при определенных естественных условиях) многие другие законы распределения. С помощью нормального закона распределения описываются также явления, подверженные действию многих независимых случайных факторов любой природы и любого закона их распределения. Перейдем к определениям.

Непрерывная случайная величина называется распределенной по нормальному закону (или закону Гаусса) , если ее плотность вероятности имеет вид:

,

где числа а и σ (σ>0 ) являются параметрами этого распределения.

Как уже было сказано, закон Гаусса распределения случайных величин имеет многочисленные приложения. По этому закону распределены ошибки измерений приборами, отклонение от центра мишени при стрельбе, размеры изготовленных деталей, вес и рост людей, годовое количество осадков, количество новорожденных и многое другое.

Приведенная формула плотности вероятности нормально распределенной случайной величины содержит, как было сказано, два параметра а и σ , а потому задает семейство функций, меняющихся в зависимости от значений этих параметров. Если применить обычные методы математического анализа исследования функций и построения графиков к плотности вероятности нормального распределения, то можно сделать следующие выводы.


являются точками его перегиба.

Исходя из полученной информации, строим график плотности вероятности f (x ) нормального распределения (он называется кривой Гаусса − рисунок).

Выясним, как влияет изменение параметров а и σ на форму кривой Гаусса. Очевидно (это видно из формулы для плотности нормального распределения), что изменение параметра а не меняет форму кривой, а приводит лишь к ее сдвигу вправо или влево вдоль оси х . Зависимость от σ сложнее. Из проведенного выше исследования видно, как зависит величина максимуму и координаты точек перегиба от параметра σ . К тому же надо учесть, что при любых параметрах а и σ площадь под кривой Гаусса остается равной 1 (это общее свойство плотности вероятности). Из сказанного следует, что с ростом параметра σ кривая становится более пологой и вытягивается вдоль оси х . На рисунке изображены кривые Гаусса при различных значениях параметра σ (σ 1 < σ< σ 2 ) и одном и том же значении параметра а .

Выясним вероятностный смысл параметров а и σ нормального распределения. Уже из симметричности кривой Гаусса относительно вертикальной прямой, проходящей через число а на оси х понятно, что среднее значение (т.е. математическое ожидание М(Х) ) нормально распределенной случайной величины равно а . Из этих же соображений мода и медиана тоже должны быть равны числу а. Точные расчеты по соответствующим формулам это подтверждают. Если же мы выписанное выше выражение для f (x ) подставим в формулу для дисперсии
, то после (достаточно непростого) вычисления интеграла получим в ответе числоσ 2 . Таким образом, для случайной величины Х , распределенной по нормальному закону, получились следующие основные ее числовые характеристики:

Поэтому вероятностный смысл параметров нормального распределения а и σ следующий. Если с.в. Х а и σ а σ.

Найдем теперь функцию распределения F (x ) для случайной величины Х , распределенной по нормальному закону, используя выписанное выше выражение для плотности вероятности f (x ) и формулу
. При подстановкеf (x ) получается «неберущийся» интеграл. Все, что удается сделать для упрощения выражения для F (x ), это представление этой функции в виде:

,

где Ф(х) − так называемая функция Лапласа , которая имеет вид

.

Интеграл, через который выражается функция Лапласа, тоже является неберущимися (но при каждом х этот интеграл может быть вычислен приближенно с любой наперед заданной точностью). Однако вычислять его и не потребуется, так как в конце любого учебника по теории вероятностей есть таблица для определения значений функции Ф(х) при заданном значении х . В дальнейшем нам понадобится свойство нечетности функции Лапласа: Ф(−х)= Ф(х) для всех чисел х .

Найдем теперь вероятность того, что нормально распределенная с.в. Х примет значение из заданного числового интервала (α, β) . Из общих свойств функции распределения Р(α< X < β)= F (β) F (α) . Подставляя α и β в выписанное выше выражение для F (x ) , получим

.

Как сказано выше, если с.в. Х распределена нормально с параметрами а и σ , то ее среднее значение равно а , а среднее квадратическое отклонение равно σ. Поэтому среднее отклонение значений этой с.в. при испытании от числа а равно σ. Но это среднее отклонение. Поэтому возможны и бо´льшие отклонения. Узнаем, насколько возможны те или иные отклонения от среднего значения. Найдем вероятность того, что значение распределенной по нормальному закону случайной величины Х отклониться от ее среднего значения М(Х)=а менее, чем на некоторое число δ, т.е. Р (| X a |<δ ) : . Таким образом,

.

Подставляя в это равенство δ=3σ , получим вероятность того, что значение с.в. Х (при одном испытании) отклонится от среднего значения менее чем на утроенное значение σ (при среднем отклонении, как мы помним, равном σ ): (значениеФ(3) взято из таблицы значений функции Лапласа). Это почти 1 ! Тогда вероятность противоположного события (что значение отклонится не менее, чем на ) равна 1 0.997=0.003 , что очень близко к 0 . Поэтому это событие «почти невозможно» случается крайне редко (в среднем 3 раза из 1000 ). Это рассуждение является обоснованием широко известного «правила трех сигм».

Правило трех сигм . Нормально распределенная случайная величина при единичном испытании практически не отклоняется от своего среднего далее, чем на .

Еще раз подчеркнем, что речь идет об одном испытании. Если испытаний случайной величины много, то вполне возможно, что какое-либо ее значение и удалится от среднего далее, чем . Это подтверждает следующий

Пример . Какова вероятность, что при 100 испытаниях нормально распределенной случайной величины Х хотя бы одно ее значение отклонится от среднего более, чем на утроенное среднее квадратическое отклонение? А при 1000 испытаниях?

Решение. Пусть событие А означает, что при испытании случайной величины Х ее значение отклонилось от среднего более, чем на 3σ. Как только что было выяснено, вероятность этого события р=Р(А)=0.003 . Проведено 100 таких испытаний. Надо узнать вероятность того, что событие А произошло хотя бы раз, т.е. произошло от 1 до 100 раз. Это типичная задача схемы Бернулли с параметрами n =100 (число независимых испытаний), р=0.003 (вероятность события А в одном испытании), q =1− p =0.997 . Требуется найти Р 100 (1≤ k ≤100) . В данном случае, конечно, проще найти сначала вероятность противоположного события Р 100 (0) − вероятность того, что событие А не произошло ни разу (т.е. произошло 0 раз) . Учитывая связь вероятностей самого события и ему противоположного, получим:

Не так уж мало. Вполне может произойти (происходит в среднем в каждой четвертой такой серии испытаний). При 1000 испытаний по такой же схеме можно получить, что вероятность хотя бы одного отклонения далее, чем на , равно: . Так что можно с большой уверенностью дождаться хотя бы одного такого отклонения.

Пример . Рост мужчин определенной возрастной группы распределен нормально с математическим ожиданием a , и среднеквадратическим отклонением σ . Какую долю костюмов k -го роста следует предусмотреть в общем объеме производства для данной возрастной группы, если k -ый рост определяется следующими пределами:

1 рост: 158 164см 2 рост: 164 − 170см 3 рост: 170 − 176см 4 рост: 176 − 182см

Решение. Решим задачу при следующих значениях параметров: а=178, σ=6, k =3 . Пусть с.в. Х рост случайно выбранного мужчины (она распределена по условию нормально с заданными параметрами). Найдем вероятность того, что наугад выбранному мужчине понадобится 3 -й рост. Пользуясь нечетностью функции Лапласа Ф(х) и таблицей ее значений: P(170 Поэтому в общем объеме производства надо предусмотреть 0.2789*100%=27.89% костюмов 3 -го роста.