Математическое ожидание для чайников. Математическое ожидание непрерывной случайной величины

Случайной величиной называют переменную величину, которая в результате каждого испытания принимает одно заранее неизвестное значение, зависящее от случайных причин. Случайные величины обозначают заглавными латинскими буквами: $X,\ Y,\ Z,\ \dots $ По своему типу случайные величины могут быть дискретными и непрерывными .

Дискретная случайная величина - это такая случайная величина, значения которой могут быть не более чем счетными, то есть либо конечными, либо счетными. Под счетностью имеется ввиду, что значения случайной величины можно занумеровать.

Пример 1 . Приведем примеры дискретных случайных величин:

а) число попаданий в мишень при $n$ выстрелах, здесь возможные значения $0,\ 1,\ \dots ,\ n$.

б) число выпавших гербов при подкидывании монеты, здесь возможные значения $0,\ 1,\ \dots ,\ n$.

в) число прибывших кораблей на борт (счетное множество значений).

г) число вызовов, поступающих на АТС (счетное множество значений).

1. Закон распределения вероятностей дискретной случайной величины.

Дискретная случайная величина $X$ может принимать значения $x_1,\dots ,\ x_n$ с вероятностями $p\left(x_1\right),\ \dots ,\ p\left(x_n\right)$. Соответствие между этими значениями и их вероятностями называется законом распределения дискретной случайной величины . Как правило, это соответствие задается с помощью таблицы, в первой строке которой указывают значения $x_1,\dots ,\ x_n$, а во второй строке соответствующие этим значениям вероятности $p_1,\dots ,\ p_n$.

$\begin{array}{|c|c|}
\hline
X_i & x_1 & x_2 & \dots & x_n \\
\hline
p_i & p_1 & p_2 & \dots & p_n \\
\hline
\end{array}$

Пример 2 . Пусть случайная величина $X$ - число выпавших очков при подбрасывании игрального кубика. Такая случайная величина $X$ может принимать следующие значения $1,\ 2,\ 3,\ 4,\ 5,\ 6$. Вероятности всех этих значений равны $1/6$. Тогда закон распределения вероятностей случайной величины $X$:

$\begin{array}{|c|c|}
\hline
1 & 2 & 3 & 4 & 5 & 6 \\
\hline

\hline
\end{array}$

Замечание . Поскольку в законе распределения дискретной случайной величины $X$ события $1,\ 2,\ \dots ,\ 6$ образуют полную группу событий, то в сумме вероятности должны быть равны единице, то есть $\sum{p_i}=1$.

2. Математическое ожидание дискретной случайной величины.

Математическое ожидание случайной величины задает ее «центральное» значение. Для дискретной случайной величины математическое ожидание вычисляется как сумма произведений значений $x_1,\dots ,\ x_n$ на соответствующие этим значениям вероятности $p_1,\dots ,\ p_n$, то есть: $M\left(X\right)=\sum^n_{i=1}{p_ix_i}$. В англоязычной литературе используют другое обозначение $E\left(X\right)$.

Свойства математического ожидания $M\left(X\right)$:

  1. $M\left(X\right)$ заключено между наименьшим и наибольшим значениями случайной величины $X$.
  2. Математическое ожидание от константы равно самой константе, т.е. $M\left(C\right)=C$.
  3. Постоянный множитель можно выносить за знак математического ожидания: $M\left(CX\right)=CM\left(X\right)$.
  4. Математическое ожидание суммы случайных величин равно сумме их математических ожиданий: $M\left(X+Y\right)=M\left(X\right)+M\left(Y\right)$.
  5. Математическое ожидание произведения независимых случайных величин равно произведению их математических ожиданий: $M\left(XY\right)=M\left(X\right)M\left(Y\right)$.

Пример 3 . Найдем математическое ожидание случайной величины $X$ из примера $2$.

$$M\left(X\right)=\sum^n_{i=1}{p_ix_i}=1\cdot {{1}\over {6}}+2\cdot {{1}\over {6}}+3\cdot {{1}\over {6}}+4\cdot {{1}\over {6}}+5\cdot {{1}\over {6}}+6\cdot {{1}\over {6}}=3,5.$$

Можем заметить, что $M\left(X\right)$ заключено между наименьшим ($1$) и наибольшим ($6$) значениями случайной величины $X$.

Пример 4 . Известно, что математическое ожидание случайной величины $X$ равно $M\left(X\right)=2$. Найти математическое ожидание случайной величины $3X+5$.

Используя вышеуказанные свойства, получаем $M\left(3X+5\right)=M\left(3X\right)+M\left(5\right)=3M\left(X\right)+5=3\cdot 2+5=11$.

Пример 5 . Известно, что математическое ожидание случайной величины $X$ равно $M\left(X\right)=4$. Найти математическое ожидание случайной величины $2X-9$.

Используя вышеуказанные свойства, получаем $M\left(2X-9\right)=M\left(2X\right)-M\left(9\right)=2M\left(X\right)-9=2\cdot 4-9=-1$.

3. Дисперсия дискретной случайной величины.

Возможные значения случайных величин с равными математическими ожиданиями могут по-разному рассеиваться вокруг своих средних значений. Например, в двух студенческих группах средний балл за экзамен по теории вероятностей оказался равным 4, но в одной группе все оказались хорошистами, а в другой группе - только троечники и отличники. Поэтому возникает необходимость в такой числовой характеристике случайной величины, которая бы показывала разброс значений случайной величины вокруг своего математического ожидания. Такой характеристикой является дисперсия.

Дисперсия дискретной случайной величины $X$ равна:

$$D\left(X\right)=\sum^n_{i=1}{p_i{\left(x_i-M\left(X\right)\right)}^2}.\ $$

В англоязычной литературе используются обозначения $V\left(X\right),\ Var\left(X\right)$. Очень часто дисперсию $D\left(X\right)$ вычисляют по формуле $D\left(X\right)=\sum^n_{i=1}{p_ix^2_i}-{\left(M\left(X\right)\right)}^2$.

Свойства дисперсии $D\left(X\right)$:

  1. Дисперсия всегда больше или равна нулю, т.е. $D\left(X\right)\ge 0$.
  2. Дисперсия от константы равна нулю, т.е. $D\left(C\right)=0$.
  3. Постоянный множитель можно выносить за знак дисперсии при условии возведения его в квадрат, т.е. $D\left(CX\right)=C^2D\left(X\right)$.
  4. Дисперсия суммы независимых случайных величин равна сумме их дисперсий, т.е. $D\left(X+Y\right)=D\left(X\right)+D\left(Y\right)$.
  5. Дисперсия разности независимых случайных величин равна сумме их дисперсий, т.е. $D\left(X-Y\right)=D\left(X\right)+D\left(Y\right)$.

Пример 6 . Вычислим дисперсию случайной величины $X$ из примера $2$.

$$D\left(X\right)=\sum^n_{i=1}{p_i{\left(x_i-M\left(X\right)\right)}^2}={{1}\over {6}}\cdot {\left(1-3,5\right)}^2+{{1}\over {6}}\cdot {\left(2-3,5\right)}^2+\dots +{{1}\over {6}}\cdot {\left(6-3,5\right)}^2={{35}\over {12}}\approx 2,92.$$

Пример 7 . Известно, что дисперсия случайной величины $X$ равна $D\left(X\right)=2$. Найти дисперсию случайной величины $4X+1$.

Используя вышеуказанные свойства, находим $D\left(4X+1\right)=D\left(4X\right)+D\left(1\right)=4^2D\left(X\right)+0=16D\left(X\right)=16\cdot 2=32$.

Пример 8 . Известно, что дисперсия случайной величины $X$ равна $D\left(X\right)=3$. Найти дисперсию случайной величины $3-2X$.

Используя вышеуказанные свойства, находим $D\left(3-2X\right)=D\left(3\right)+D\left(2X\right)=0+2^2D\left(X\right)=4D\left(X\right)=4\cdot 3=12$.

4. Функция распределения дискретной случайной величины.

Способ представления дискретной случайной величины в виде ряда распределения не является единственным, а главное он не является универсальным, поскольку непрерывную случайную величину нельзя задать с помощью ряда распределения. Существует еще один способ представления случайной величины - функция распределения.

Функцией распределения случайной величины $X$ называется функция $F\left(x\right)$, которая определяет вероятность того, что случайная величина $X$ примет значение, меньшее некоторого фиксированного значения $x$, то есть $F\left(x\right)=P\left(X < x\right)$

Свойства функции распределения :

  1. $0\le F\left(x\right)\le 1$.
  2. Вероятность того, что случайная величина $X$ примет значения из интервала $\left(\alpha ;\ \beta \right)$, равна разности значений функции распределения на концах этого интервала: $P\left(\alpha < X < \beta \right)=F\left(\beta \right)-F\left(\alpha \right)$
  3. $F\left(x\right)$ - неубывающая.
  4. ${\mathop{lim}_{x\to -\infty } F\left(x\right)=0\ },\ {\mathop{lim}_{x\to +\infty } F\left(x\right)=1\ }$.

Пример 9 . Найдем функцию распределения $F\left(x\right)$ для закона распределения дискретной случайной величины $X$ из примера $2$.

$\begin{array}{|c|c|}
\hline
1 & 2 & 3 & 4 & 5 & 6 \\
\hline
1/6 & 1/6 & 1/6 & 1/6 & 1/6 & 1/6 \\
\hline
\end{array}$

Если $x\le 1$, то, очевидно, $F\left(x\right)=0$ (в том числе и при $x=1$ $F\left(1\right)=P\left(X < 1\right)=0$).

Если $1 < x\le 2$, то $F\left(x\right)=P\left(X=1\right)=1/6$.

Если $2 < x\le 3$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)=1/6+1/6=1/3$.

Если $3 < x\le 4$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)=1/6+1/6+1/6=1/2$.

Если $4 < x\le 5$, то $F\left(X\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)+P\left(X=4\right)=1/6+1/6+1/6+1/6=2/3$.

Если $5 < x\le 6$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)+P\left(X=4\right)+P\left(X=5\right)=1/6+1/6+1/6+1/6+1/6=5/6$.

Если $x > 6$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)+P\left(X=4\right)+P\left(X=5\right)+P\left(X=6\right)=1/6+1/6+1/6+1/6+1/6+1/6=1$.

Итак, $F(x)=\left\{\begin{matrix}
0,\ при\ x\le 1,\\
1/6,при\ 1 < x\le 2,\\
1/3,\ при\ 2 < x\le 3,\\
1/2,при\ 3 < x\le 4,\\
2/3,\ при\ 4 < x\le 5,\\
5/6,\ при\ 4 < x\le 5,\\
1,\ при\ x > 6.
\end{matrix}\right.$

Понятие математического ожидания можно рассмотреть на примере с бросанием игрального кубика. При каждом броске фиксируются выпавшие очки. Для их выражения используются натуральные значения в диапазоне 1 – 6.

После определенного количества бросков при помощи не сложных расчетов можно найти среднее арифметическое значение выпавших очков.

Также, как и выпадение любого из значений диапазона, эта величина будет случайной.

А если увеличить количество бросков в несколько раз? При больших количествах бросков среднее арифметическое значение очков будет приближаться к конкретному числу, получившему в теории вероятностей название математического ожидания.

Итак, под математическим ожиданием понимается среднее значение случайной величины. Данный показатель может представляться и в качестве взвешенной суммы значений вероятной величины.

Это понятие имеет несколько синонимов:

  • среднее значение;
  • средняя величина;
  • показатель центральной тенденции;
  • первый момент.

Иными словами, оно является ничем иным как числом вокруг которого распределяются значения случайной величины.

В различных сферах человеческой деятельности подходы к пониманию математического ожидания будут несколько отличаться.

Оно может рассматриваться как:

  • средняя выгода, полученная от принятия какого-то решения, в том случае, когда такое решение рассматривается с точки зрения теории больших чисел;
  • возможная сумма выигрыша либо проигрыша (теория азартных игр), рассчитанная в среднем для каждой из ставок. На сленге они звучат как «преимущество игрока» (позитивно для игрока) либо «преимущество казино» (негативно для игрока);
  • процент прибыли, полученной от выигрыша.

Матожидание не является обязательным для абсолютно всех случайных величин. Оно отсутствует для тех у которых наблюдается расхождение соответствующей суммы или интеграла.

Свойства математического ожидания

Как и любому статистическому параметру, математическому ожиданию присущи свойства:


Основные формулы для математического ожидания

Вычисление математического ожидания может выполняться как для случайных величин, характеризующихся как непрерывностью (формула А), так и дискретностью (формула Б):

  1. M(X)=∑i=1nxi⋅pi, где xi – значения случайной величины, pi – вероятности:
  2. M(X)=∫+∞−∞f(x)⋅xdx, где f(x) – заданная плотность вероятностей.

Примеры вычисления математического ожидания

Пример А.

Можно ли узнать средний рост гномов в сказке о Белоснежке. Известно, что каждый из 7 гномов имел определенный рост: 1,25; 0,98; 1,05; 0,71; 0,56; 0,95 и 0,81 м.

Алгоритм вычислений достаточно прост:

  • находим сумму всех значений показателя роста (случайная величина):
    1,25+0,98+1,05+0,71+0,56+0,95+ 0,81 = 6,31;
  • полученную сумму делим на количество гномов:
    6,31:7=0,90.

Таким образом, средний рост гномов в сказке равен 90 см. Иными словами таково математическое ожидание роста гномов.

Рабочая формула — М(х)=4 0,2+6 0,3+10 0,5=6

Практическая реализация математического ожидания

К вычислению статистического показателя математического ожидания прибегают в различных сферах практической деятельности. В первую очередь речь идет о коммерческой сфере. Ведь введение Гюйгенсом этого показателя связано с определением шансов, которые могут быть благоприятными, либо напротив неблагоприятными, для какого-то события.

Этот параметр широко применяется для оценки рисков, особенно если речь идет о финансовых вложениях.
Так, в предпринимательстве расчет математического ожидания выступает в качестве метода для оценивания риска при расчете цен.

Также данный показатель может использоваться при расчете эффективности проведения тех или иных мероприятий, например, по охране труда. Благодаря ему можно вычислить вероятность наступления события.

Еще одна сфера применения данного параметра – менеджмент. Также он может рассчитываться при контроле качества продукции. Например, при помощи мат. ожидания можно рассчитать возможное количество изготовления бракованных деталей.

Незаменимым мат.ожидание оказывается и при проведении статистической обработки полученных в ходе научных исследований результатов. Он позволяет рассчитать и вероятность проявления желательного либо нежелательного исхода эксперимента или исследования в зависимости от уровня достижения поставленной цели. Ведь ее достижение может ассоциироваться с выигрышем и выгодой, а ее не достижение – в качестве проигрыша либо убытка.

Использование математического ожидания на Форекс

Практическое применение данного статистического параметра возможно при проведении операций на валютном рынке. С его помощью можно осуществлять анализ успешности торговых сделок. При чем увеличение значения ожидания свидетельствует об увеличении их успешности.

Также важно помнить, что математическое ожидание не должно рассматриваться в качестве единственного статистического параметра используемого для анализа работы трейдера. Использование нескольких статистических параметров наряду со средним значением повышает точность проводимого анализа в разы.

Данный параметр хорошо зарекомендовал себя при мониторинговых наблюдениях за торговыми счетами. Благодаря ему выполняется быстрая оценка работ, осуществляемых на депозитном счете. В тех случаях, когда деятельность трейдера удачна и он избегает убытков, пользоваться исключительно расчетом математического ожидания не рекомендуется. В этих случаях не учитываются риски, что снижает эффективность анализа.

Проведенные исследования тактик трейдеров свидетельствуют о том, что:

  • наиболее эффективными оказываются тактики, базирующиеся на случайном входе;
  • наименее эффективны – тактики, базирующиеся на структурированных входах.

В достижении позитивных результатов не менее важны:

  • тактика управления капиталом;
  • стратегии выходов.

Используя такой показатель как математическое ожидание можно предположить каким будет прибыль либо убыток при вложении 1 доллара. Известно, что этот показатель, рассчитанный для всех игр, практикуемых в казино, в пользу заведения. Именно это позволяет зарабатывать деньги. В случае длинной серии игр вероятность потери денег клиентом существенно возрастает.

Игры профессиональных игроков ограничены небольшими временными промежутками, что увеличивает вероятность выигрыша и снижает риск проигрыша. Такая же закономерность наблюдается и при выполнении инвестиционных операций.

Инвестор может заработать значительную сумму при положительном ожидании и совершении большого количества сделок за небольшой временной промежуток.

Ожидание может рассматриваться как разница между произведением процента прибыли (PW) на среднюю прибыль (AW) и вероятность убытка (PL) на средний убыток (AL).

В качестве примера можно рассмотреть следующий: позиция – 12,5 тыс. долларов, портфель — 100 тыс. долларов, риск на депозит – 1%. Прибыльность сделок составляет 40% случаев при средней прибыли 20%. В случае убытка средние потери составляют 5%. Расчет математического ожидания для сделки дает значение в 625 долларов.

Теория вероятности - особый раздел математики, который изучают только студенты высших учебных заведений. Вы любите расчёты и формулы? Вас не пугают перспективы знакомства с нормальным распределением, энтропией ансамбля, математическим ожиданием и дисперсией дискретной случайной величины? Тогда этот предмет вам будет очень интересен. Давайте познакомимся с несколькими важнейшими базовыми понятиями этого раздела науки.

Вспомним основы

Даже если вы помните самые простые понятия теории вероятности, не пренебрегайте первыми абзацами статьи. Дело в том, что без четкого понимания основ вы не сможете работать с формулами, рассматриваемыми далее.

Итак, происходит некоторое случайное событие, некий эксперимент. В результате производимых действий мы можем получить несколько исходов - одни из них встречаются чаще, другие - реже. Вероятность события - это отношение количества реально полученных исходов одного типа к общему числу возможных. Только зная классическое определение данного понятия, вы сможете приступить к изучению математического ожидания и дисперсии непрерывных случайных величин.

Среднее арифметическое

Ещё в школе на уроках математики вы начинали работать со средним арифметическим. Это понятие широко используется в теории вероятности, и потому его нельзя обойти стороной. Главным для нас на данный момент является то, что мы столкнемся с ним в формулах математического ожидания и дисперсии случайной величины.

Мы имеем последовательность чисел и хотим найти среднее арифметическое. Всё, что от нас требуется - просуммировать всё имеющееся и разделить на количество элементов в последовательности. Пусть мы имеем числа от 1 до 9. Сумма элементов будет равна 45, и это значение мы разделим на 9. Ответ: - 5.

Дисперсия

Говоря научным языком, дисперсия - это средний квадрат отклонений полученных значений признака от среднего арифметического. Обозначается одна заглавной латинской буквой D. Что нужно, чтобы её рассчитать? Для каждого элемента последовательности посчитаем разность между имеющимся числом и средним арифметическим и возведем в квадрат. Значений получится ровно столько, сколько может быть исходов у рассматриваемого нами события. Далее мы суммируем всё полученное и делим на количество элементов в последовательности. Если у нас возможны пять исходов, то делим на пять.

У дисперсии есть и свойства, которые нужно запомнить, чтобы применять при решении задач. Например, при увеличении случайной величины в X раз, дисперсия увеличивается в X в квадрате раз (т. е. X*X). Она никогда не бывает меньше нуля и не зависит от сдвига значений на равное значение в большую или меньшую сторону. Кроме того, для независимых испытаний дисперсия суммы равна сумме дисперсий.

Теперь нам обязательно нужно рассмотреть примеры дисперсии дискретной случайной величины и математического ожидания.

Предположим, что мы провели 21 эксперимент и получили 7 различных исходов. Каждый из них мы наблюдали, соответственно, 1,2,2,3,4,4 и 5 раз. Чему будет равна дисперсия?

Сначала посчитаем среднее арифметическое: сумма элементов, разумеется, равна 21. Делим её на 7, получая 3. Теперь из каждого числа исходной последовательности вычтем 3, каждое значение возведем в квадрат, а результаты сложим вместе. Получится 12. Теперь нам остается разделить число на количество элементов, и, казалось бы, всё. Но есть загвоздка! Давайте её обсудим.

Зависимость от количества экспериментов

Оказывается, при расчёте дисперсии в знаменателе может стоять одно из двух чисел: либо N, либо N-1. Здесь N - это число проведенных экспериментов или число элементов в последовательности (что, по сути, одно и то же). От чего это зависит?

Если количество испытаний измеряется сотнями, то мы должны ставить в знаменатель N. Если единицами, то N-1. Границу ученые решили провести достаточно символически: на сегодняшний день она проходит по цифре 30. Если экспериментов мы провели менее 30, то делить сумму будем на N-1, а если более - то на N.

Задача

Давайте вернемся к нашему примеру решения задачи на дисперсию и математическое ожидание. Мы получили промежуточное число 12, которое нужно было разделить на N или N-1. Поскольку экспериментов мы провели 21, что меньше 30, выберем второй вариант. Итак, ответ: дисперсия равна 12 / 2 = 2.

Математическое ожидание

Перейдем ко второму понятию, которое мы обязательно должны рассмотреть данной статье. Математическое ожидание - это результат сложения всех возможных исходов, помноженных на соответствующие вероятности. Важно понимать, что полученное значение, как и результат расчёта дисперсии, получается всего один раз для целой задачи, сколько бы исходов в ней не рассматривалось.

Формула математического ожидания достаточно проста: берем исход, умножаем на его вероятность, прибавляем то же самое для второго, третьего результата и т. д. Всё, связанное с этим понятием, рассчитывается несложно. Например, сумма матожиданий равна матожиданию суммы. Для произведения актуально то же самое. Такие простые операции позволяет с собой выполнять далеко не каждая величина в теории вероятности. Давайте возьмем задачу и посчитаем значение сразу двух изученных нами понятий. Кроме того, мы отвлекались на теорию - пришло время попрактиковаться.

Ещё один пример

Мы провели 50 испытаний и получили 10 видов исходов - цифры от 0 до 9 - появляющихся в различном процентном отношении. Это, соответственно: 2%, 10%, 4%, 14%, 2%,18%, 6%, 16%, 10%, 18%. Напомним, что для получения вероятностей требуется разделить значения в процентах на 100. Таким образом, получим 0,02; 0,1 и т.д. Представим для дисперсии случайной величины и математического ожидания пример решения задачи.

Среднее арифметическое рассчитаем по формуле, которую помним с младшей школы: 50/10 = 5.

Теперь переведем вероятности в количество исходов «в штуках», чтобы было удобнее считать. Получим 1, 5, 2, 7, 1, 9, 3, 8, 5 и 9. Из каждого полученного значения вычтем среднее арифметическое, после чего каждый из полученных результатов возведем в квадрат. Посмотрите, как это сделать, на примере первого элемента: 1 - 5 = (-4). Далее: (-4) * (-4) = 16. Для остальных значений проделайте эти операции самостоятельно. Если вы всё сделали правильно, то после сложения всех вы получите 90.

Продолжим расчёт дисперсии и математического ожидания, разделив 90 на N. Почему мы выбираем N, а не N-1? Правильно, потому что количество проведенных экспериментов превышает 30. Итак: 90/10 = 9. Дисперсию мы получили. Если у вас вышло другое число, не отчаивайтесь. Скорее всего, вы допустили банальную ошибку при расчётах. Перепроверьте написанное, и наверняка всё встанет на свои места.

Наконец, вспомним формулу математического ожидания. Не будем приводить всех расчётов, напишем лишь ответ, с которым вы сможете свериться, закончив все требуемые процедуры. Матожидание будет равно 5,48. Напомним лишь, как осуществлять операции, на примере первых элементов: 0*0,02 + 1*0,1… и так далее. Как видите, мы просто умножаем значение исхода на его вероятность.

Отклонение

Ещё одно понятие, тесно связанное с дисперсией и математическим ожиданием - среднее квадратичное отклонение. Обозначается оно либо латинскими буквами sd, либо греческой строчной «сигмой». Данное понятие показывает, насколько в среднем отклоняются значения от центрального признака. Чтобы найти её значение, требуется рассчитать квадратный корень из дисперсии.

Если вы построите график нормального распределения и захотите увидеть непосредственно на нём квадратичного отклонения, это можно сделать в несколько этапов. Возьмите половину изображения слева или справа от моды (центрального значения), проведите перпендикуляр к горизонтальной оси так, чтобы площади получившихся фигур были равны. Величина отрезка между серединой распределения и получившейся проекцией на горизонтальную ось и будет представлять собой среднее квадратичное отклонение.

Программное обеспечение

Как видно из описаний формул и представленных примеров, расчеты дисперсии и математического ожидания - не самая простая процедура с арифметической точки зрения. Чтобы не тратить время, имеет смысл воспользоваться программой, используемой в высших учебных заведениях - она называется «R». В ней есть функции, позволяющие рассчитывать значения для многих понятий из статистики и теории вероятности.

Например, вы задаете вектор значений. Делается это следующим образом: vector <-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

В заключение

Дисперсия и математическое ожидание - это без которых сложно в дальнейшем что-либо рассчитать. В основном курсе лекций в вузах они рассматриваются уже в первые месяцы изучения предмета. Именно из-за непонимания этих простейших понятий и неумения их рассчитать многие студенты сразу начинают отставать по программе и позже получают плохие отметки по результатам сессии, что лишает их стипендии.

Потренируйтесь хотя бы одну неделю по полчаса в день, решая задания, схожие с представленными в данной статье. Тогда на любой контрольной по теории вероятности вы справитесь с примерами без посторонних подсказок и шпаргалок.

Следующим по важности свойством случайной величины вслед за математическим ожиданием является ее дисперсия, определяемая как средний квадрат отклонения от среднего:

Если обозначить через то дисперсия VX будет ожидаемым значением Это характеристика „разброса" распределения X.

В качестве простого примера вычисления дисперсии предположим, что нам только что сделали предложение, от которого мы не в силах отказаться: некто подарил нам два сертификата для участия в одной лотерее. Устроители лотереи продают каждую неделю по 100 билетов, участвующих в отдельном тираже. В тираже выбирается один их этих билетов посредством равномерного случайного процесса - каждый билет имеет равные шансы быть выбранным - и обладатель этого счастливого билета получает сто миллионов долларов. Остальные 99 владельцев лотерейных билетов не выигрывают ничего.

Мы можем использовать подарок двумя способами: купить или два билета в одной лотерее, или по одному для участия в двух разных лотереях. Какая стратегия лучше? Попытаемся провести анализ. Для этого обозначим через случайные величины, представляющие размер нашего выигрыша по первому и второму билету. Ожидаемое значение в миллионах, равно

и то же самое справедливо для Ожидаемые значения аддитивны, поэтому наш средний суммарный выигрыш составит

независимо от принятой стратегии.

Тем не менее, две стратегии выглядят различными. Выйдем за рамки ожидаемых значений и изучим полностью распределение вероятностей

Если мы купим два билета в одной лотерее, то наши шансы не выиграть ничего составят 98% и 2% - шансы на выигрыш 100 миллионов. Если же мы купим билеты на разные тиражи, то цифры будут такими: 98.01% - шанс не выиграть ничего, что несколько больше, чем ранее; 0.01% - шанс выиграть 200 миллионов, также чуть больше, чем было ранее; и шанс выиграть 100 миллионов теперь составляет 1.98%. Таким образом, во втором случае распределение величины несколько более разбросано; среднее значение, 100 миллионов долларов, несколько менее вероятно, тогда как крайние значения более вероятны.

Именно это понятие разброса случайной величины призвана отразить дисперсия. Мы измеряем разброс через квадрат отклонения случайной величины от ее математического ожидания. Таким образом, в случае 1 дисперсия составит

в случае 2 дисперсия равна

Как мы и ожидали, последняя величина несколько больше, поскольку распределение в случае 2 несколько более разбросано.

Когда мы работаем с дисперсиями, то все возводится в квадрат, так что в результате могут получиться весьма большие числа. (Множитель есть один триллион, это должно впечатлить

даже привычных к крупным ставкам игроков.) Для преобразования величин в более осмысленную исходную шкалу часто извлекают квадратный корень из дисперсии. Полученное число называется стандартным отклонением и обычно обозначается греческой буквой а:

Стандартные отклонения величины для наших двух лотерейных стратегий составят . В некотором смысле второй вариант примерно на 71247 долларов рискованнее.

Каким образом дисперсия помогает в выборе стратегии? Это не ясно. Стратегия с большей дисперсией рискованнее; но что лучше для нашего кошелька - риск или безопасная игра? Пусть у нас есть возможность купить не два билета, а все сто. Тогда мы могли бы гарантировать выигрыш в одной лотерее (и дисперсия была бы нулевой); или же можно было сыграть в сотне разных тиражей, ничего не получая с вероятностью зато имея ненулевой шанс на выигрыш вплоть до долларов. Выбор одной из этих альтернатив лежит за рамками этой книги; все, что мы можем сделать здесь,- это объяснить, как произвести подсчеты.

В действительности имеется более простой способ вычисления дисперсии, чем прямое использование определения (8.13). (Есть все основания подозревать здесь какую-то скрытую от глаз математику; иначе с чего бы дисперсия в лотерейных примерах оказалась целым кратным Имеем

поскольку - константа; следовательно,

„Дисперсия есть среднее значение квадрата минус квадрат среднего значения"

Например, в задаче про лотерею средним значением оказывается или Вычитание (квадрата среднего) дает результаты, которые мы уже получили ранее более трудным путем.

Есть, однако, еще более простая формула, применимая, когда мы вычисляем для независимых X и Y. Имеем

поскольку, как мы знаем, для независимых случайных величин Следовательно,

„Дисперсия суммы независимых случайных величин равняется сумме их дисперсий" Так, например, дисперсия суммы, которую можно выиграть на один лотерейный билет, равняется

Следовательно, дисперсия суммарного выигрыша по двум лотерейным билетам в двух различных (независимых) лотереях составит Соответствующее значение дисперсии для независимых лотерейных билетов будет

Дисперсия суммы очков, выпавших на двух кубиках, может быть получена по той же формуле, поскольку есть сумма двух независимых случайных величин. Имеем

для правильного кубика; следовательно, случае смещенного центра масс

следовательно, если у обоих кубиков центр масс смещен. Заметьте, что в последнем случае дисперсия больше, хотя принимает среднее значение 7 чаще, чем в случае правильных кубиков. Если наша цель - выбросить побольше приносящих удачу семерок, то дисперсия - не лучший показатель успеха.

Ну хорошо, мы установили, как вычислить дисперсию. Но мы пока не дали ответа на вопрос, почему надо вычислять именно дисперсию. Все так делают, но почему? Основная причина заключается в неравенстве Чебышева которое устанавливает важное свойство дисперсии:

(Это неравенство отличается от неравенств Чебышёва для сумм, встретившихся нам в гл. 2.) На качественном уровне (8.17) утверждает, что случайная величина X редко принимает значения, далекие от своего среднего если ее дисперсия VX мала. Доказательство

тельство необычайно просто. Действительно,

деление на завершает доказательство.

Если мы обозначим математическое ожидание через а стандартное отклонение - через а и заменим в (8.17) на то условие превратится в следовательно, мы получим из (8.17)

Таким образом, X будет лежать в пределах -кратного стандартного отклонения от своего среднего значения за исключением случаев, вероятность которых не превышает Случайная величина будет лежать в пределах 2а от по крайней мере для 75% испытаний; в пределах от до - по крайней мере для 99%. Это случаи неравенства Чебышёва.

Если бросить пару кубиков раз, то общая сумма очков во всех бросаниях почти всегда, при больших будет близка к Причина этого следующая: дисперсия независимых бросаний составит Дисперсия в означает стандартное отклонение всего

Поэтому из неравенства Чебышёва получаем, что сумма очков будет лежать между

по крайней мере для 99% всех бросаний правильных кубиков. Например, итог миллиона бросаний с вероятностью более 99% будет заключен между 6.976 млн и 7.024 млн.

В общем случае, пусть X - любая случайная величина на вероятностном пространстве П, имеющая конечное математическое ожидание и конечное стандартное отклонение а. Тогда можно ввести в рассмотрение вероятностное пространство Пп, элементарными событиями которого являются -последовательности где каждое , а вероятность определяется как

Если теперь определить случайные величины формулой

то величина

будет суммой независимых случайных величин, которая соответствует процессу суммирования независимых реализаций величины X на П. Математическое ожидание будет равно а стандартное отклонение - ; следовательно, среднее значение реализаций,

будет лежать в пределах от до по крайней мере в 99% временного периода. Иными словами, если выбрать достаточно большое то среднее арифметическое независимых испытаний будет почти всегда очень близко к ожидаемому значению (В учебниках теории вероятностей доказывается еще более сильная теорема, называемая усиленным законом больших чисел; но нам достаточно и простого следствия неравенства Чебышёва, которое мы только что вывели.)

Иногда нам не известны характеристики вероятностного пространства, но требуется оценить математическое ожидание случайной величины X при помощи повторных наблюдений ее значения. (Например, нам могла бы понадобиться средняя полуденная температура января в Сан-Франциско; или же мы хотим узнать ожидаемую продолжительность жизни, на которой должны основывать свои расчеты страховые агенты.) Если в нашем распоряжении имеются независимые эмпирические наблюдения то мы можем предположить, что истинное математическое ожидание приблизительно равно

Можно оценить и дисперсию, используя формулу

Глядя на эту формулу, можно подумать, что в ней - типографская ошибка; казалось бы, там должно стоять как в (8.19), поскольку истинное значение дисперсии определяется в (8.15) через ожидаемые значения. Однако замена здесь на позволяет получить лучшую оценку, поскольку из определения (8.20) вытекает, что

Вот доказательство:

(В этой выкладке мы опираемся на независимость наблюдений, когда заменяем на )

На практике для оценки результатов эксперимента со случайной величиной X обычно вычисляют эмпирическое среднее и эмпирическое стандартное отклонение после чего записывают ответ в виде Вот, например, результаты бросаний пары кубиков, предположительно правильных.

– количество мальчиков среди 10 новорождённых.

Совершенно понятно, что это количество заранее не известно, и в очередном десятке родившихся детей может оказаться:

Либо мальчиков – один и только один из перечисленных вариантов.

И, дабы соблюсти форму, немного физкультуры:

– дальность прыжка в длину (в некоторых единицах) .

Её не в состоянии предугадать даже мастер спорта:)

Тем не менее, ваши гипотезы?

2) Непрерывная случайная величина – принимает все числовые значения из некоторого конечного или бесконечного промежутка.

Примечание : в учебной литературе популярны аббревиатуры ДСВ и НСВ

Сначала разберём дискретную случайную величину, затем – непрерывную .

Закон распределения дискретной случайной величины

– этосоответствие между возможными значениями этой величины и их вероятностями. Чаще всего закон записывают таблицей:

Довольно часто встречается термин ряд распределения , но в некоторых ситуациях он звучит двусмысленно, и поэтому я буду придерживаться «закона».

А теперь очень важный момент : поскольку случайная величина обязательно примет одно из значений , то соответствующие события образуют полную группу и сумма вероятностей их наступления равна единице:

или, если записать свёрнуто:

Так, например, закон распределения вероятностей выпавших на кубике очков имеет следующий вид:

Без комментариев.

Возможно, у вас сложилось впечатление, что дискретная случайная величина может принимать только «хорошие» целые значения. Развеем иллюзию – они могут быть любыми:

Пример 1

Некоторая игра имеет следующий закон распределения выигрыша:

…наверное, вы давно мечтали о таких задачах:) Открою секрет – я тоже. В особенности после того, как завершил работу над теорией поля .

Решение : так как случайная величина может принять только одно из трёх значений, то соответствующие события образуют полную группу , а значит, сумма их вероятностей равна единице:

Разоблачаем «партизана»:

– таким образом, вероятность выигрыша условных единиц составляет 0,4.

Контроль: , в чём и требовалось убедиться.

Ответ :

Не редкость, когда закон распределения требуется составить самостоятельно. Для этого используют классическое определение вероятности , теоремы умножения / сложения вероятностей событий и другие фишки тервера :

Пример 2

В коробке находятся 50 лотерейных билетов, среди которых 12 выигрышных, причём 2 из них выигрывают по 1000 рублей, а остальные – по 100 рублей. Составить закон распределения случайной величины – размера выигрыша, если из коробки наугад извлекается один билет.

Решение : как вы заметили, значения случайной величины принято располагать в порядке их возрастания . Поэтому мы начинаем с самого маленького выигрыша, и именно рублей.

Всего таковых билетов 50 – 12 = 38, и по классическому определению :
– вероятность того, что наудачу извлечённый билет окажется безвыигрышным.

С остальными случаями всё просто. Вероятность выигрыша рублей составляет:

Проверка: – и это особенно приятный момент таких заданий!

Ответ : искомый закон распределения выигрыша:

Следующее задание для самостоятельного решения:

Пример 3

Вероятность того, что стрелок поразит мишень, равна . Составить закон распределения случайной величины – количества попаданий после 2 выстрелов.

…я знал, что вы по нему соскучились:) Вспоминаем теоремы умножения и сложения . Решение и ответ в конце урока.

Закон распределения полностью описывает случайную величину, однако на практике бывает полезно (а иногда и полезнее) знать лишь некоторые её числовые характеристики .

Математическое ожидание дискретной случайной величины

Говоря простым языком, это среднеожидаемое значение при многократном повторении испытаний. Пусть случайная величина принимает значения с вероятностями соответственно. Тогда математическое ожидание данной случайной величины равно сумме произведений всех её значений на соответствующие вероятности:

или в свёрнутом виде:

Вычислим, например, математическое ожидание случайной величины – количества выпавших на игральном кубике очков:

Теперь вспомним нашу гипотетическую игру:

Возникает вопрос: а выгодно ли вообще играть в эту игру? …у кого какие впечатления? Так ведь «навскидку» и не скажешь! Но на этот вопрос можно легко ответить, вычислив математическое ожидание, по сути – средневзвешенный по вероятностям выигрыш:

Таким образом, математическое ожидание данной игры проигрышно .

Не верь впечатлениям – верь цифрам!

Да, здесь можно выиграть 10 и даже 20-30 раз подряд, но на длинной дистанции нас ждёт неминуемое разорение. И я бы не советовал вам играть в такие игры:) Ну, может, только ради развлечения .

Из всего вышесказанного следует, что математическое ожидание – это уже НЕ СЛУЧАЙНАЯ величина.

Творческое задание для самостоятельного исследования:

Пример 4

Мистер Х играет в европейскую рулетку по следующей системе: постоянно ставит 100 рублей на «красное». Составить закон распределения случайной величины – его выигрыша. Вычислить математическое ожидание выигрыша и округлить его до копеек. Сколько в среднем проигрывает игрок с каждой поставленной сотни?

Справка : европейская рулетка содержит 18 красных, 18 чёрных и 1 зелёный сектор («зеро»). В случае выпадения «красного» игроку выплачивается удвоенная ставка, в противном случае она уходит в доход казино

Существует много других систем игры в рулетку, для которых можно составить свои таблицы вероятностей. Но это тот случай, когда нам не нужны никакие законы распределения и таблицы, ибо доподлинно установлено, что математическое ожидание игрока будет точно таким же. От системы к системе меняется лишь