Распределение вероятностей

Категории Теория вероятностей | Под редакцией сообщества: Математика

Распределение вероятностей – вероятностная мера на измеримом пространстве.

Пусть W - непустое множество произвольной природы и Ƒ -s- алгебра на W, то есть совокупность подмножеств W, содержащая само W, пустое множество Æ, и замкнутая относительно не более, чем счетного множества теоретико-множественных операций (это означает, что для любого A Î Ƒ множество = W\A вновь принадлежит Ƒ и если A₁, A₂,…Î Ƒ, то Ƒ и Ƒ). Пара (W,Ƒ) называется измеримым пространством. Неотрицательная функция P(A), определенная для всех A Î Ƒ, называется вероятностной мерой, вероятностью, Р. вероятностей или просто Р., если P(W) = 1 и P является счетно-аддитивной, то есть для любой последовательности A₁, A₂,…Î Ƒ такой, что A_i ∩ A_j = Æ для всех i ¹ j, справедливо равенство P() = P(A_i). Тройка (W, Ƒ, P) называется вероятностным пространством. Вероятностное пространство является исходным понятием аксиоматической теории вероятностей, предложенной А.Н. Колмогоровым в начале 1930 гг.

На каждом вероятностном пространстве можно рассматривать (действительные) измеримые функции X = X(w), wÎW, то есть такие функции, что {w: X(w) Î B} Î Ƒ для любого борелевского подмножества B действительной прямой R. Измеримость функции X эквивалентна тому, что {w: X(w) < x} Î Ƒ для любого действительного x. Измеримые функции называются случайными величинами. Каждая случайная величина X, опреде-ленная на вероятностном пространстве (W, Ƒ, P), порождает Р. вероятностей

P_X(B) = P(XÎB) = P({w: X(w) Î B}), B ÎƁ,
на измеримом пространстве (R, Ɓ ), где Ɓ - совокупность всех борелевских подмножеств R, и функцию распределения

F_X(x) = P(X < x) = P({w: X(w) < x}), -¥ < x <¥,
которые называются Р. вероятностей и функцией распределения случайной величины X.

Функция распределения F любой случайной величины обладает свойствами

1. F(x) неубывает,

2. F(- ¥) = 0, F(¥) = 1,

3. F(x) непрерывна слева в каждой точке x.

Иногда в определении функции распределения неравенство < заменяется неравенством £; в этом случае функция распределения является непрерывной справа. В содержательных утверждениях теории вероятностей не важно, непрерывна функция распределения слева или справа, важны лишь положения ее точек разрыва x (если они есть) и величины приращений F(x+0) – F(x-0) в этих точках; если F – функция распределения случайной величины X, то это приращение есть P(X = x).

Любая функция F, обладающая свойствами 1. – 3. называется функцией распреде-ления. Соответствие между распределениями на (R, Ɓ ) и функциями распределения взаимно однозначно. Для любого Р. P на (R, Ɓ ) его функция распределения определяется равенством F(x) = P((-¥, x)), -¥ < x <¥, а для любой функции распределения F соответствующее ей Р. P определяется на алгебре £ множеств, состоящей из объединений конечного числа непересекающихся промежутков [a, b ), -¥ < a < b < ¥, равенством , а затем P продолжается на наименьшую s-алгебру, содержащую £, то есть на Ɓ.

Для любой функции распределения F (то есть для любой функции, обладающей свойствами 1. – 3.) существует вероятностное пространство (W, Ƒ, P) и на нем измеримая функция X такие, что функция распределения F_X совпадает с F. В качестве множества W можно взять действительную прямую R, в качестве Ƒ - совокупность всех борелевских подмножеств R и в качестве P - Р., соответствующее функции распределения F. На этом вероятностном пространстве функция X(w) = w является случайной величиной и ее функция распределения F_X совпадает с F. Существуют вероятностные пространства, на которых для любой функции распределения F можно указать случайную величину X, для которой F_X совпадает с F. Таким пространством является, например, интервал (0, 1) с s-алгеброй борелевских подмножеств этого интервала и мерой Лебега.

Далее рассматриваются Р. только на (R, Ɓ ).

Поскольку между Р. и функциями распределения существует взаимно однозначное соответствие, эти термины часто используются как синонимы. Р. вероятностей иногда называются законами Р. Важнейшими классами Р. являются абсолютно непрерывные, дискретные и сингулярные Р.

Р. называется абсолютно непрерывным, если его функция распределения представима в виде

, -¥ < x < ¥,
где p(u) – неотрицательная функция, называемая плотностью этого Р. В точках непрерыв-ности плотности p(x) = F¢ (x). Всякая неотрицательная функция p(u), -¥ < u < ¥, такая, что , является плотностью некоторого Р.

Для любой функции распределения множество ее точек разрыва не более, чем счетно. Р. называется дискретным, если его функция распределения F изменяется только в точках x₁, x₂,… скачками, величины которых – положительные числа
p₁, p₂,… , p₁ + p₂ + … = 1. Если F – функция распределения случайной величины X, то P(X = x_i) = p_i, i = 1, 2, ... Такие случайные величины также называются дискретными. Р. дискретной случайной величины X с конечным множеством возможных значений иногда задают табличкой

x₁	x₂	…	x_m
p₁	p₂	…	p_m

в верхней строке которой указаны возможные значения X, а в нижней – вероятности этих значений. Такая табличка также называется Р. вероятностей случайной величины X.

Точка x называется точкой роста функции распределения F, если F(x+e) - F(x-e)>0 для любого e > 0. Множество всех точек роста функции распределения F называется ее носителем и обозначается supp F. Если P - Р., соответствующее функции распределения F, то P(supp F) = 1.

Р. называется сингулярным, если его функция распределения F непрерывна и мера Лебега множества supp F равна нулю. Самый известный пример сингулярной функции распределения F – так наз. Канторова лестница, которая строится следующим образом. Пусть F₁(x), F₂(x),… - последовательность функций распределения, которые равны нулю при x < 0 и равны единице при x > 1. На отрезке [0 ,1] функция F₁(x) линейно возрастает от 0 до 1. Для построения функции F₂(x) отрезок [0, 1] разбиваеся на отрезок [0, 1/3], интервал (1/3, 2/3) и отрезок [2/3, 1]. Функция F₂(x) на интервале (1/3, 2/3) равна 1/2 и линейно возрастает от 0 до 1/2 и от 1/2 до 1 на отрезках [0, 1/3] и [2/3, 1] соответственно. Этот процесс продолжается и функция F_n₊₁ получается с помощью следующего преобразования функции F_n, n ³ 2. На интервалах, где функция F_n(x) постоянна, F_n₊₁(x) совпадает с F_n(x). Каждый отрезок [a, b], где функция F_n(x) линейно возрастает от a до b, разбивается на отрезок [a, a + (b - a)/3] , интервал (a + (a - b)/3, a + 2(b - a)/3) и отрезок [a + 2(b - a)/3, b]. На указанном интервале F_n₊₁(x) равна (a + b)/2, а на указанных отрезках F_n₊₁(x) линейно возрастает от a до (a + b)/2и от (a + b)/2 до b соответственно. Для каждого 0 £ x £ 1 последовательность F_n(x), n = 1, 2,..., сходится к некоторому числу F(x). Последо-вательность функций распределения F_n, n = 1, 2,..., равностепенно непрерывна, поэтому предельная функция распределения F(x) является непрерывной. Эта функция постоянна на счетном множестве интервалов (значения функции на разных интервалах различны), на которых нет ее точек роста, а суммарная длина этих интервалов равна 1. Поэтому мера Лебега множества supp F равна нулю, то есть F сингулярна.

Каждая функция распределения может быть представлена в виде

F(x) = p_acF_ac(x) + p_dF_d(x) + p_sF_s(x),
где F_ac, F_d и F_s абсолютно непрерывная, дискретная и сингулярная функции распреде-ления, а сумма неотрицательных чисел p_ac, p_d и p_s равна единице. Это представление называется разложением Лебега, а функции F_ac, F_d и F_s – компонентами разложения.

Функция распределения называется симметричной, если F(-x) = 1 - F(x + 0) для
x > 0. Если симметричная функция распределения абсолютно непрерывна, то ее плотность – четная функция. Если случайная величина X имеет симметричное распределение, то случайные величины X и -X одинаково распределены. Если симметричная функция распределения F(x) непрерывна в нуле, то F(0) = 1/2.

Среди часто используемых в теории вероятностей абсолютно непрерывных Р. – равномерное Р., нормальное Р. (Р. Гаусса), экспоненциальное Р. и Р. Коши.

Р. называется равномерным на интервале (a, b) ( или на отрезке [a, b], или на промежутках [a, b) и (a, b]), если его плотность постоянна (и равна 1/(b - a)) на (a, b) и равна нулю вне (a, b). Чаще всего используется равномерное Р. на (0, 1), его функция распределения F(x) равна нулю при x £ 0, равна единице при x >1 и F(x) = x при 0 < x £ 1. Равномерное Р. на (0, 1) имеет случайная величина X(w) = w на вероятностном прост-ранстве, состоящем из интервала (0, 1), совокупности борелевских подмножеств этого интервала и меры Лебега. Это вероятностное пространство соответствует эксперименту «бросание точки w наудачу на интервал (0, 1)», где слово «наудачу» означает равноправие («равновозможность») всех точек из (0, 1). Если на вероятностном пространстве (W, Ƒ, P) существует случайная величина X с равномерным Р. на (0, 1), то на нем для любой функ-ции распределения F существует случайная величина Y, для которой функция распределе-ния F_Y совпадает с F. Например, функция распределения случайной величины Y = F^-1(X) совпадает с F. Здесь F^-1(y) = inf{x: F(x) > y}, 0 < y < 1; если функция F(x) непрерывна и строго монотонна на всей действительной прямой, то F^-1 – функция, обратная F.

Нормальным Р. с параметрами (a, s²), -¥ < a < ¥, s² > 0, называется Р. с плотностью , -¥ < x < ¥. Чаще всего используется нормальное Р. с параметрами a = 0 и s² = 1, которое называется стандартным нормальным Р., его функция распределения F(x) через суперпозиции элементарные функций не выражается и приходится использовать ее интегральное представление F(x) =, -¥ < x < ¥. Для фунции распределения F(x) составлены подробные таблицы, которые были необходимы до того как появилась современная вычислительная техника (значения функции F(x) можно получать и с помощью таблиц спец. функции erf(x)), значения F(x) для x > 0 можно получать с помощью суммы ряда

,
а для x < 0 можно воспользоваться симметричностью F(x). Значения нормальной функции распределения с параметрами a и s² можно получать, пользуясь тем, что она совпадает с F((x - a)/s). Если X₁ и X₂ независимые нормально распределенные с параметрами a₁, s₁² и a₂, s₂² случайные величины, то распределение их суммы X₁ + X₂ также нормально с параметрами a= a₁ + a₂ и s² = s₁² + s₂². Верно и утверждение, в некотором смысле, обратное: если случайная величина X нормально распределена с параметрами a и s², и
Х = X₁ + X₂, где X₁ и X₂ – независимые случайные величины, отличные от постоянных, то X₁ и X₂ имеют нормальные распределения (теорема Крамера). Параметры a₁, s₁² и a₂, s₂² распределений нормальных случайных величин X₁ и X₂ связаны с a и s² равенствами, приведенными выше. Стандартное нормальное распределение является предельным в центральной предельной теореме.

Экспоненциальным Р. называется распределение с плотностью p(x) = 0 при x < 0 и p(x) = le^-^lx при x ³ 0, где l > 0 – параметр, его функция распределения F(x) = 0 при x £ 0 и F(x) = 1 - e^-^lx при x > 0 (иногда используются экспоненциальные Р., отличающиеся от указанного сдвигом по действительной оси). Это Р. обладает свойством, которое называ-ется отсутствием последействия: если X – случайная величина с экспоненциальным Р., то для любых положительных x и t

P(X > x + t | X > x) = P(X > t).
Если X – время работы некоторого прибора до отказа, то отсутствие последействия озна-чает, что вероятность того, что прибор, включенный в момент времени 0, не откажет до момента x + t при условии, что он не отказал до момента x, не зависит от x. Это свойство интерпретируется как отсутствие «старения». Отсутствие последействия является харак-теризационным свойством экспоненциального Р.: в классе абсолютно непрерывных распределений указанное выше равенство справедливо только для экспоненциального Р. (с некоторым параметром l > 0). Экспоненциальное Р. появляется как предельное Р. в схеме минимума. Пусть X₁, X₂,… - неотрицательные независимые одинаково распреде-ленные случайны величины и для их общей функция распределения F точка 0 является точкой роста. Тогда при n®¥ распределения случайных величин Y_n = min(X₁,…, X_n) слабо сходятся к вырожденному распределению с единственной точкой роста 0 (это – аналог закона больших чисел). Если дополнительно предположить, что для некоторого e > 0 функция распределения F(x) на интервале (0, e) допускает представление и p(u)®l при u ¯ 0, то функции распределения случайных величин Z_n = n min(X₁,…, X_n) при n®¥ равномерно по -¥ < x < ¥ сходятся к экспоненциальной функции распределения с параметром l (это - аналог центральной предельной теоремы).

Р. Коши называется Р. с плотностью p(x) = 1/(p(1 + x²)), -¥ < x < ¥, его функция рас-пределения F(x) = (arctg x + p/2)/p. Это Р. появилось в работе С.Пуассона в 1832 г. в связи с решением следующей задачи: существуют ли независимые одинаково распределенные случайные величины X₁, X₂,… такие, что средние арифметические (X₁ + … + X_n)/n при каждом n имеют то же Р., что и каждая из случайных величин X₁, X₂,…? С. Пуассон обна-ружил, что таким свойством обладают случайные величины с указанной плотностью. Для этих случайных величин не выполняется утверждение закона больших чисел, в котором средние арифметические (X₁ +…+ X_n)/n при росте n вырождаются. Однако, это не проти-воречит закону больших чисел, поскольку в нем на распределения исходных случайных величин налагаются ограничения, которые для указанного распределения не выполнены (для этого распределения существуют абсолютные моменты всех положительных поряд-ков, меньших единицы, но математическое ожидание не существует). В работах О.Коши Р., носящее его имя, появилось в 1853 г. Р. Коши имеет отношение X/Y независимых случайных величин со стандартным нормальным Р.

Среди часто используемых в теории вероятностей дискретных Р. – Р. Бернулли, биномиальное Р. и Р. Пуассона.

Р. Бернулли называется любое распределение с двумя точками роста. Чаще всего используется Р. случайной величины X, принимающей значения 0 и 1 с вероятностями
q = 1 - p и p соответственно, где 0 < p < 1 – параметр. Первые формы закона больших чисел и центральной предельной теоремы были получены для случайных величин, имею-щих Р. Бернулли. Если на вероятностном пространстве (W, Ƒ, P) существует последова-тельность X₁, X₂,… независимых случайных величин, принимающих значения 0 и 1 с вероятностями 1/2 каждое, то на этом вероятностном пространстве существует слчайная величина с равномерным Р. на (0, 1). В частности, случайная величина имеет равномерное распределение на (0, 1).

Биномиальным Р. с параметрами n и p, n – натуральное, 0 < p < 1, называется Р., с точками роста 0, 1,..., n, в которых сосредоточены вероятности C_n^kp^kqⁿ^-k, k = 0, 1,…, n,
q = 1 - p. Оно является Р. суммы n независимых случайных величин, имеющих Р. Бернулли с точками роста 0 и 1, в которых сосредоточены вероятности q и p. Изучение этого распределения привело Я.Бернулли к открытию закона больших чисел, а А.Муавра – к открытию центральной предельной теоремы.

Р. Пуассона называется Р., носитель которого – последовательность точек 0, 1,..., в которых сосредоточены вероятности l^ke^-^l/k!, k = 0, 1,…, где l > 0 – параметр. Сумма двух независимых случайных величин, имеющих Р. Пуассона с параметрами l и m вновь имеет Р. Пуассона с параметром l + m. Р. Пуассона является предельным для Р. Бернулли с пара-метрами n и p = p(n) при n®¥, если n и p связаны соотношением np®l при n®¥ (теорема Пуассона). Если последовательность 0 < T₁ < T₂ < T₃ <… есть последовательность моментов времени, в которые происходят некоторые события (так. наз поток событий) и величины T₁, T₂ -T₁, T₃ – T₂,… являются независимыми одинаково распределенными случайными величинами и их общее Р. – экспоненциальное с параметром l > 0, то случайная величина X_t, равная числу событий, наступивших на интервале (0, t), имеет Р. Пуассона с параметром .lt (такой поток называется пуассоновским).