Распределение вероятностей
Распределение вероятностей – вероятностная мера на измеримом пространстве.
Пусть W - непустое множество произвольной природы и Ƒ -s- алгебра на W, то есть совокупность подмножеств W, содержащая само W, пустое множество Æ, и замкнутая относительно не более, чем счетного множества теоретико-множественных операций (это означает, что для любого A Î Ƒ множество = W\A вновь принадлежит Ƒ и если A1, A2,…Î Ƒ, то Ƒ и Ƒ). Пара (W,Ƒ) называется измеримым пространством. Неотрицательная функция P(A), определенная для всех A Î Ƒ, называется вероятностной мерой, вероятностью, Р. вероятностей или просто Р., если P(W) = 1 и P является счетно-аддитивной, то есть для любой последовательности A1, A2,…Î Ƒ такой, что Ai ∩ Aj = Æ для всех i ¹ j, справедливо равенство P() = P(Ai). Тройка (W, Ƒ, P) называется вероятностным пространством. Вероятностное пространство является исходным понятием аксиоматической теории вероятностей, предложенной А.Н. Колмогоровым в начале 1930 гг.
На каждом вероятностном пространстве можно рассматривать (действительные) измеримые функции X = X(w), wÎW, то есть такие функции, что {w: X(w) Î B} Î Ƒ для любого борелевского подмножества B действительной прямой R. Измеримость функции X эквивалентна тому, что {w: X(w) < x} Î Ƒ для любого действительного x. Измеримые функции называются случайными величинами. Каждая случайная величина X, опреде-ленная на вероятностном пространстве (W, Ƒ, P), порождает Р. вероятностей
PX (B) = P(XÎB) = P({w: X(w) Î B}), B ÎƁ,
на измеримом пространстве (R, Ɓ ), где Ɓ - совокупность всех борелевских подмножеств R, и функцию распределения
FX(x) = P(X < x) = P({w: X(w) < x}), -¥ < x <¥,
которые называются Р. вероятностей и функцией распределения случайной величины X.
Функция распределения F любой случайной величины обладает свойствами
1. F(x) неубывает,
2. F(- ¥) = 0, F(¥) = 1,
3. F(x) непрерывна слева в каждой точке x.
Иногда в определении функции распределения неравенство < заменяется неравенством £; в этом случае функция распределения является непрерывной справа. В содержательных утверждениях теории вероятностей не важно, непрерывна функция распределения слева или справа, важны лишь положения ее точек разрыва x (если они есть) и величины приращений F(x+0) – F(x-0) в этих точках; если F – функция распределения случайной величины X, то это приращение есть P(X = x).
Любая функция F, обладающая свойствами 1. – 3. называется функцией распреде-ления. Соответствие между распределениями на (R, Ɓ ) и функциями распределения взаимно однозначно. Для любого Р. P на (R, Ɓ ) его функция распределения определяется равенством F(x) = P((-¥, x)), -¥ < x <¥, а для любой функции распределения F соответствующее ей Р. P определяется на алгебре £ множеств, состоящей из объединений конечного числа непересекающихся промежутков [a, b ), -¥ < a < b < ¥, равенством , а затем P продолжается на наименьшую s-алгебру, содержащую £, то есть на Ɓ.
Для любой функции распределения F (то есть для любой функции, обладающей свойствами 1. – 3.) существует вероятностное пространство (W, Ƒ, P) и на нем измеримая функция X такие, что функция распределения FX совпадает с F. В качестве множества W можно взять действительную прямую R, в качестве Ƒ - совокупность всех борелевских подмножеств R и в качестве P - Р., соответствующее функции распределения F. На этом вероятностном пространстве функция X(w) = w является случайной величиной и ее функция распределения FX совпадает с F. Существуют вероятностные пространства, на которых для любой функции распределения F можно указать случайную величину X, для которой FX совпадает с F. Таким пространством является, например, интервал (0, 1) с s-алгеброй борелевских подмножеств этого интервала и мерой Лебега.
Далее рассматриваются Р. только на (R, Ɓ ).
Поскольку между Р. и функциями распределения существует взаимно однозначное соответствие, эти термины часто используются как синонимы. Р. вероятностей иногда называются законами Р. Важнейшими классами Р. являются абсолютно непрерывные, дискретные и сингулярные Р.
Р. называется абсолютно непрерывным, если его функция распределения представима в виде
, -¥ < x < ¥,
где p(u) – неотрицательная функция, называемая плотностью этого Р. В точках непрерыв-ности плотности p(x) = F¢ (x). Всякая неотрицательная функция p(u), -¥ < u < ¥, такая, что , является плотностью некоторого Р.
Для любой функции распределения множество ее точек разрыва не более, чем счетно. Р. называется дискретным, если его функция распределения F изменяется только в точках x1, x2,… скачками, величины которых – положительные числа
p1, p2,… , p1 + p2 + … = 1. Если F – функция распределения случайной величины X, то P(X = xi) = pi, i = 1, 2, ... Такие случайные величины также называются дискретными. Р. дискретной случайной величины X с конечным множеством возможных значений иногда задают табличкой
x1 |
x2 |
… |
xm |
p1 |
p2 |
… |
pm |
в верхней строке которой указаны возможные значения X, а в нижней – вероятности этих значений. Такая табличка также называется Р. вероятностей случайной величины X.
Точка x называется точкой роста функции распределения F, если F(x+e) - F(x-e)>0 для любого e > 0. Множество всех точек роста функции распределения F называется ее носителем и обозначается supp F. Если P - Р., соответствующее функции распределения F, то P(supp F) = 1.
Р. называется сингулярным, если его функция распределения F непрерывна и мера Лебега множества supp F равна нулю. Самый известный пример сингулярной функции распределения F – так наз. Канторова лестница, которая строится следующим образом. Пусть F1(x), F2(x),… - последовательность функций распределения, которые равны нулю при x < 0 и равны единице при x > 1. На отрезке [0 ,1] функция F1(x) линейно возрастает от 0 до 1. Для построения функции F2(x) отрезок [0, 1] разбиваеся на отрезок [0, 1/3], интервал (1/3, 2/3) и отрезок [2/3, 1]. Функция F2(x) на интервале (1/3, 2/3) равна 1/2 и линейно возрастает от 0 до 1/2 и от 1/2 до 1 на отрезках [0, 1/3] и [2/3, 1] соответственно. Этот процесс продолжается и функция Fn+1 получается с помощью следующего преобразования функции Fn, n ³ 2. На интервалах, где функция Fn(x) постоянна, Fn+1(x) совпадает с Fn(x). Каждый отрезок [a, b], где функция Fn(x) линейно возрастает от a до b, разбивается на отрезок [a, a + (b - a)/3] , интервал (a + (a - b)/3, a + 2(b - a)/3) и отрезок [a + 2(b - a)/3, b]. На указанном интервале Fn+1(x) равна (a + b)/2, а на указанных отрезках Fn+1(x) линейно возрастает от a до (a + b)/2и от (a + b)/2 до b соответственно. Для каждого 0 £ x £ 1 последовательность Fn(x), n = 1, 2,..., сходится к некоторому числу F(x). Последо-вательность функций распределения Fn, n = 1, 2,..., равностепенно непрерывна, поэтому предельная функция распределения F(x) является непрерывной. Эта функция постоянна на счетном множестве интервалов (значения функции на разных интервалах различны), на которых нет ее точек роста, а суммарная длина этих интервалов равна 1. Поэтому мера Лебега множества supp F равна нулю, то есть F сингулярна.
Каждая функция распределения может быть представлена в виде
F(x) = pac Fac(x) + pd Fd(x) + ps Fs(x),
где Fac, Fd и Fs абсолютно непрерывная, дискретная и сингулярная функции распреде-ления, а сумма неотрицательных чисел pac, pd и ps равна единице. Это представление называется разложением Лебега, а функции Fac, Fd и Fs – компонентами разложения.
Функция распределения называется симметричной, если F(-x) = 1 - F(x + 0) для
x > 0. Если симметричная функция распределения абсолютно непрерывна, то ее плотность – четная функция. Если случайная величина X имеет симметричное распределение, то случайные величины X и -X одинаково распределены. Если симметричная функция распределения F(x) непрерывна в нуле, то F(0) = 1/2.
Среди часто используемых в теории вероятностей абсолютно непрерывных Р. – равномерное Р., нормальное Р. (Р. Гаусса), экспоненциальное Р. и Р. Коши.
Р. называется равномерным на интервале (a, b) ( или на отрезке [a, b], или на промежутках [a, b) и (a, b]), если его плотность постоянна (и равна 1/(b - a)) на (a, b) и равна нулю вне (a, b). Чаще всего используется равномерное Р. на (0, 1), его функция распределения F(x) равна нулю при x £ 0, равна единице при x >1 и F(x) = x при 0 < x £ 1. Равномерное Р. на (0, 1) имеет случайная величина X(w) = w на вероятностном прост-ранстве, состоящем из интервала (0, 1), совокупности борелевских подмножеств этого интервала и меры Лебега. Это вероятностное пространство соответствует эксперименту «бросание точки w наудачу на интервал (0, 1)», где слово «наудачу» означает равноправие («равновозможность») всех точек из (0, 1). Если на вероятностном пространстве (W, Ƒ, P) существует случайная величина X с равномерным Р. на (0, 1), то на нем для любой функ-ции распределения F существует случайная величина Y, для которой функция распределе-ния FY совпадает с F. Например, функция распределения случайной величины Y = F-1(X) совпадает с F. Здесь F-1(y) = inf{x: F(x) > y}, 0 < y < 1; если функция F(x) непрерывна и строго монотонна на всей действительной прямой, то F-1 – функция, обратная F.
Нормальным Р. с параметрами (a, s2), -¥ < a < ¥, s2 > 0, называется Р. с плотностью , -¥ < x < ¥. Чаще всего используется нормальное Р. с параметрами a = 0 и s2 = 1, которое называется стандартным нормальным Р., его функция распределения F(x) через суперпозиции элементарные функций не выражается и приходится использовать ее интегральное представление F(x) =, -¥ < x < ¥. Для фунции распределения F(x) составлены подробные таблицы, которые были необходимы до того как появилась современная вычислительная техника (значения функции F(x) можно получать и с помощью таблиц спец. функции erf(x)), значения F(x) для x > 0 можно получать с помощью суммы ряда
,
а для x < 0 можно воспользоваться симметричностью F(x). Значения нормальной функции распределения с параметрами a и s2 можно получать, пользуясь тем, что она совпадает с F((x - a)/s). Если X1 и X2 независимые нормально распределенные с параметрами a1, s12 и a2, s22 случайные величины, то распределение их суммы X1 + X2 также нормально с параметрами a= a1 + a2 и s2 = s12 + s22. Верно и утверждение, в некотором смысле, обратное: если случайная величина X нормально распределена с параметрами a и s2, и
Х = X1 + X2, где X1 и X2 – независимые случайные величины, отличные от постоянных, то X1 и X2 имеют нормальные распределения (теорема Крамера). Параметры a1, s12 и a2, s22 распределений нормальных случайных величин X1 и X2 связаны с a и s2 равенствами, приведенными выше. Стандартное нормальное распределение является предельным в центральной предельной теореме.
Экспоненциальным Р. называется распределение с плотностью p(x) = 0 при x < 0 и p(x) = le-lx при x ³ 0, где l > 0 – параметр, его функция распределения F(x) = 0 при x £ 0 и F(x) = 1 - e-lx при x > 0 (иногда используются экспоненциальные Р., отличающиеся от указанного сдвигом по действительной оси). Это Р. обладает свойством, которое называ-ется отсутствием последействия: если X – случайная величина с экспоненциальным Р., то для любых положительных x и t
P(X > x + t | X > x) = P(X > t).
Если X – время работы некоторого прибора до отказа, то отсутствие последействия озна-чает, что вероятность того, что прибор, включенный в момент времени 0, не откажет до момента x + t при условии, что он не отказал до момента x, не зависит от x. Это свойство интерпретируется как отсутствие «старения». Отсутствие последействия является харак-теризационным свойством экспоненциального Р.: в классе абсолютно непрерывных распределений указанное выше равенство справедливо только для экспоненциального Р. (с некоторым параметром l > 0). Экспоненциальное Р. появляется как предельное Р. в схеме минимума. Пусть X1, X2,… - неотрицательные независимые одинаково распреде-ленные случайны величины и для их общей функция распределения F точка 0 является точкой роста. Тогда при n®¥ распределения случайных величин Yn = min(X1,…, Xn) слабо сходятся к вырожденному распределению с единственной точкой роста 0 (это – аналог закона больших чисел). Если дополнительно предположить, что для некоторого e > 0 функция распределения F(x) на интервале (0, e) допускает представление и p(u)®l при u ¯ 0, то функции распределения случайных величин Zn = n min(X1,…, Xn) при n®¥ равномерно по -¥ < x < ¥ сходятся к экспоненциальной функции распределения с параметром l (это - аналог центральной предельной теоремы).
Р. Коши называется Р. с плотностью p(x) = 1/(p(1 + x2)), -¥ < x < ¥, его функция рас-пределения F(x) = (arctg x + p/2)/p. Это Р. появилось в работе С.Пуассона в 1832 г. в связи с решением следующей задачи: существуют ли независимые одинаково распределенные случайные величины X1, X2,… такие, что средние арифметические (X1 + … + Xn)/n при каждом n имеют то же Р., что и каждая из случайных величин X1, X2,…? С. Пуассон обна-ружил, что таким свойством обладают случайные величины с указанной плотностью. Для этих случайных величин не выполняется утверждение закона больших чисел, в котором средние арифметические (X1 +…+ Xn)/n при росте n вырождаются. Однако, это не проти-воречит закону больших чисел, поскольку в нем на распределения исходных случайных величин налагаются ограничения, которые для указанного распределения не выполнены (для этого распределения существуют абсолютные моменты всех положительных поряд-ков, меньших единицы, но математическое ожидание не существует). В работах О.Коши Р., носящее его имя, появилось в 1853 г. Р. Коши имеет отношение X/Y независимых случайных величин со стандартным нормальным Р.
Среди часто используемых в теории вероятностей дискретных Р. – Р. Бернулли, биномиальное Р. и Р. Пуассона.
Р. Бернулли называется любое распределение с двумя точками роста. Чаще всего используется Р. случайной величины X, принимающей значения 0 и 1 с вероятностями
q = 1 - p и p соответственно, где 0 < p < 1 – параметр. Первые формы закона больших чисел и центральной предельной теоремы были получены для случайных величин, имею-щих Р. Бернулли. Если на вероятностном пространстве (W, Ƒ, P) существует последова-тельность X1, X2,… независимых случайных величин, принимающих значения 0 и 1 с вероятностями 1/2 каждое, то на этом вероятностном пространстве существует слчайная величина с равномерным Р. на (0, 1). В частности, случайная величина имеет равномерное распределение на (0, 1).
Биномиальным Р. с параметрами n и p, n – натуральное, 0 < p < 1, называется Р., с точками роста 0, 1,..., n, в которых сосредоточены вероятности Cnkpkqn-k, k = 0, 1,…, n,
q = 1 - p. Оно является Р. суммы n независимых случайных величин, имеющих Р. Бернулли с точками роста 0 и 1, в которых сосредоточены вероятности q и p. Изучение этого распределения привело Я.Бернулли к открытию закона больших чисел, а А.Муавра – к открытию центральной предельной теоремы.
Р. Пуассона называется Р., носитель которого – последовательность точек 0, 1,..., в которых сосредоточены вероятности lke-l/k!, k = 0, 1,…, где l > 0 – параметр. Сумма двух независимых случайных величин, имеющих Р. Пуассона с параметрами l и m вновь имеет Р. Пуассона с параметром l + m. Р. Пуассона является предельным для Р. Бернулли с пара-метрами n и p = p(n) при n®¥, если n и p связаны соотношением np®l при n®¥ (теорема Пуассона). Если последовательность 0 < T1 < T2 < T3 <… есть последовательность моментов времени, в которые происходят некоторые события (так. наз поток событий) и величины T1, T2 -T1, T3 – T2,… являются независимыми одинаково распределенными случайными величинами и их общее Р. – экспоненциальное с параметром l > 0, то случайная величина Xt, равная числу событий, наступивших на интервале (0, t), имеет Р. Пуассона с параметром .lt (такой поток называется пуассоновским).
Понятие Р. имеет многочисленные обобщения, в частности, оно распространяется на многомерный случай и на алгебраические структуры.
В.В. Сенатов
Выходные данные:
- Просмотров: 1366
- Комментариев: 0
- Опубликовано: 03.03.2011
- Версий: 3 , текущая: 3
- Статус: экспертная
- Рейтинг: 100.0
Автор:
Сенатов Владимир Васильевич
- профессор; доктор физико-математических наук
Ссылки отсюда
Персоны:
Колмогоров Андрей Николаевич; Пуассон Симеон Дени; Сенатов Владимир Васильевич;
Категории:Детализирующие понятия:Ссылки сюда
Детализирующие понятия: