Нормальное распределение случайной величины - примеры

0
0

Нормальное распределение является одним из наиболее фундаментальных и широко используемых вероятностных распределений. Его изящная математическая форма позволяет описывать огромное количество процессов в природе и технике. Давайте разберемся, что представляет собой это удивительное распределение и почему оно так часто встречается в реальных задачах.

1. Определение нормального распределения случайной величины

Нормальным или гауссовским называется распределение случайной величины X, функция плотности вероятности которого имеет вид:

Здесь μ - математическое ожидание случайной величины X, имеющей нормальное распределение, а σ2 - ее дисперсия. Из определения видно, что нормальное распределение полностью задается всего двумя параметрами - μ и σ2. Этим объясняется его исключительная роль как универсальной модели случайных процессов в природе.

2. График нормального распределения случайных величин

График функции плотности нормального распределения имеет характерную колоколообразную форму, за что его также называют кривой Гаусса или Гауссовым колоколом:

Из графика видно, что наибольшая плотность вероятности достигается в точке μ и плавно убывает по мере удаления от нее. Такая симметричная форма соответствует интуитивному представлению о том, что наиболее вероятные значения случайной величины сосредоточены около среднего μ.

3. Примеры случайных величин, имеющих нормальное распределение

Какие же процессы в природе могут быть описаны с помощью нормального закона? Ниже приведено несколько характерных примеров.

3.1. Рост и вес людей

Измерения роста и веса в больших выборках людей часто подчиняются нормальному закону. Например, согласно исследованиям средний рост мужчин в России составляет 178 см, а стандартное отклонение - 7 см. Значит, большинство мужчин имеют рост в диапазоне 171-185 см. Вес также распределен нормально вокруг некоторого среднего значения.

3.2. Температура воздуха

Если измерять температуру воздуха многократно в одной и той же местности в одно и то же время года, то полученные значения будут подчиняться закону нормального распределения. Наблюдаемая температура является суммой большого числа случайных факторов: движение воздушных масс, облачность, осадки и т.д. Центральная предельная теорема утверждает, что сумма таких случайных величин стремится к нормальному распределению.

Многолюдная городская улица в час пик

3.3. Ошибки измерений приборов

Любые измерительные приборы имеют собственную погрешность, обусловленную неидеальностью их устройства. Если проводить много измерений одной и той же физической величины с помощью такого прибора, то ошибки этих измерений будут подчиняться нормальному закону распределения.

Приведенные выше примеры иллюстрируют, что нормальное распределение возникает везде, где результирующий эффект определяется сложным образом множеством слабо зависимых факторов. Это объясняет его исключительную роль как универсальной модели случайных процессов в окружающем мире.

Старинный аналоговый измерительный прибор с движущейся стрелкой

3.4. Результаты тестирования студентов

Результаты тестирования больших групп студентов по какому-либо предмету также часто подчиняются нормальному закону распределения. Каждый отдельный студент получает свой результат под влиянием множества случайных факторов: качество подготовки, настроение в день теста, уровень сложности заданий и т.д. Центральная предельная теорема утверждает, что суммарный эффект этих факторов приводит распределение результатов к нормальному виду.

4. Выводы из нормального распределения случайных величин

4.1. 68–95–99,7 правило

Из свойств нормального распределения вытекает так называемое правило трех сигм. Оно утверждает, что в интервале (μ - 3σ, μ + 3σ) находится около 99,7% значений случайной величины. Аналогично, в интервалы размером 2σ и 1σ попадает соответственно 95% и 68% всех наблюдаемых значений. Это правило широко используется в статистике для определения доверительных интервалов и выявления аномальных выбросов.

4.2. Частные случаи стандартного нормального распределения

Стандартным нормальным называется распределение со средним 0 и сигмой 1 (μ = 0, σ = 1). Вероятностные характеристики стандартного нормального распределения вычислены с высокой точностью и приводятся в справочниках и таблицах. Для перехода к стандартному виду достаточно нормировать произвольную нормальную случайную величину по формуле:

4.3. Применение при аппроксимации других законов распределения

Многие распределения, используемые в приложениях, можно аппроксимировать нормальным законом. Например, биномиальное или пуассоновское распределение при больших значениях параметров n и λ достаточно хорошо описывается нормальным. Это используется в статистическом анализе для упрощения расчетов.

5. Как получается нормальное распределение случайных величин

5.1. Предельный переход биномиального распределения

Одним из способов теоретического получения нормального распределения является предельный переход от биномиального распределения. Если в биномиальном распределении количество испытаний n стремится к бесконечности, а вероятность успеха p стремится к нулю так, что произведение np остается конечным, то распределение сходится к нормальному закону с математическим ожиданием, равным np.

5.2. Центральная предельная теорема

Другим фундаментальным результатом, объясняющим происхождение нормального распределения, является центральная предельная теорема. Она утверждает, что сумма достаточно большого числа независимых одинаково распределенных случайных величин имеет приближенно нормальное распределение вне зависимости от вида исходных распределений. Этим объясняется применимость нормального закона к описанию совокупного эффекта большого числа слабо зависимых факторов.

5.3. Сумма большого числа независимых случайных величин

На практике нормальное распределение часто возникает при сложении большого числа независимых случайных величин. Согласно центральной предельной теореме, даже если каждая слагаемая имеет произвольный вид распределения, сумма в пределе больших чисел приобретает нормальный закон. Этим объясняется, почему многие природные процессы с большим числом случайных факторов так хорошо описываются нормальным распределением.

6. Моделирование нормального распределения случайных величин

6.1. Метод Бокса-Мюллера

Одним из наиболее распространенных методов генерации нормально распределенных псевдослучайных чисел является метод Бокса-Мюллера. Он основан на преобразовании двух независимых равномерно распределенных случайных чисел в два нормально распределенных. Этот метод прост в реализации и обеспечивает хорошее качество моделирования.

6.2. Алгоритм Зиггурат

Другой эффективный способ генерации нормально распределенных случайных чисел - алгоритм Зиггурат (Ziggurat algorithm). Он использует предварительно подготовленные таблицы для сверхбыстрого отображения равномерного распределения в нормальное. Этот алгоритм сложнее в реализации, но обеспечивает высокую скорость генерации.

6.3. Сравнение методов моделирования

Метод Бокса-Мюллера и алгоритм Зиггурат имеют свои преимущества и недостатки. Метод Бокса-Мюллера проще реализовать, но немного медленнее в вычислительном плане. Алгоритм Зиггурат, наоборот, требует предварительной подготовки таблиц значений, что усложняет его применение, но зато он позволяет очень быстро генерировать большие объемы нормально распределенных данных.

7. Многомерное нормальное распределение

7.1. Определение многомерного нормального распределения

Понятие нормального распределения можно обобщить на многомерный случай. Многомерным нормальным называется совместное распределение вектора случайных величин, у которого любая линейная комбинация этих величин имеет одномерное нормальное распределение. Такое распределение полностью задается вектором математических ожиданий и ковариационной матрицей.

7.2. Связь с одномерным нормальным распределением

Можно показать, что если случайный вектор имеет многомерное нормальное распределение, то каждая его компонента в отдельности распределена по одномерному нормальному закону. Обратное вообще говоря неверно. Таким образом, многомерное нормальное распределение является более сильным предположением по сравнению с набором одномерных нормальных распределений.

7.3. Примеры многомерных нормальных распределений

Многомерные нормальные распределения широко используются в задачах статистики, анализа данных, распознавания образов. Классическим примером является описание роста и веса людей с помощью двумерного нормального распределения. Другие примеры включают анализ финансовых данных, классификацию изображений и многое другое.