Министерство образования и науки Российской Федерации
ГОУ ВПО «Магнитогорский государственный университет»
Е.Н. Гусева
ТЕОРИЯ ВЕРОЯТНОСТЕЙ
И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Учебное пособие
5-е издание, стереотипное
Москва
Издательство «ФЛИНТА»
2011
ББК В17/172 УДК 372.016:519.2 Г96 Р е ц е н з е н т ы:
доктор физико-математеческих наук, профессор Магнитогорского государственного университета С.И. Кадченко;
кандидат технических наук, доцент Магнитогорского государственного технического университета А.В. Леднов Гусева Е.Н.
Г96 Теория вероятностей и математическая статистика :
[электронный ресурс] учеб. пособие / Е. Н. Гусева. – 5-е изд., стереотип. – М.: ФЛИНТА, 2011. – 220 с.
ISBN 978-5-9765-1192- Пособие содержит теоретические основы курса «Теория вероятностей и математическая статистика», а также лабораторный практикум. Издание адресовано студентам высших учебных заведений, изучающим теорию вероятностей и математическую статистику.
© Гусева Е.Н., ISBN 978-5-9765-1192- Оглавление Основы теории вероятностей и математической статистики....... Классическая и статистическая модели вероятности................. Условная вероятность. Полная вероятность.Формула Байеса... Распределения дискретных случайных величин
Распределения непрерывных случайных величин
Числовые характеристики случайных величин
Введение в математическую статистику
Выборочная совокупность. Вариационный ряд
Статистические оценки параметров распределения................. Линейный корреляционный анализ
Основы дисперсионного анализа
Факторный анализ
Линейный регрессионный анализ
Предельные теоремы теории вероятностей
Лабораторный практикум
Основы статистической обработки информации.............. Распределения непрерывных случайных величин
Выборочные распределения
Проверка гипотез на основе критерия согласия Пирсона... Основы корреляционного анализа
Линейный регрессионный анализ
Доверительные интервалы
Множественный регрессионный анализ
Список рекомендуемой литературы
Основы теории вероятностей и математической статистики Цель: познакомиться с основными понятиями теории вероятностей, изучить аксиоматический подход к определению понятия «вероятность».
Из истории статистики Статистика имеет многовековую историю, уходя своими корнями в глубокую древность. Исторически развитие статистики было связано с возникновением государств, потребностями в их эффективном управлении. Первая публикация по статистике – это «Книга Чисел» в Библии в Ветхом Завете, в которой рассказано о переписи военнообязанных, проведенной Моисеем и Аароном.
Хозяйственные и военные нужды городов и государств древнего мира требовали знаний о населении, его составе, имуществе. Первые статистические сведения собирались для налогообложения, учета земель, призыва на военную службу. В античном мире подсчитывалось число родившихся детей, велись земельные кадастры, появились первые описания государств.
Благодаря Аристотелю (384–322 гг. до н.э.) можно узнать о городах и государствах того времени. Сбор и обработка данных о массовых общественных явлениях со временем приобрели регулярный характер.
Некоторые разделы статистики были разработаны на основе изучении теории азартных игр в XVI–XVII вв. Исследованиями в этой области занимались Д. Кардано, Х. Гюйгенс, Б. Паскаль, П. Ферма и др. Следующий этап развития науки связан с именем Я. Бернулли (1654–1705). Теорема Бернулли, названная «Законом больших чисел», была первым теоретическим обоснованием накопленных ранее фактов (при достаточно большом количестве испытаний вероятность события почти равна частоте этого события).
В конце XVII в. при страховании кораблей, начали подсчитывать, сколько шансов на то, что корабль вернется в порт невредимым, не будет потоплен бурей, что груз не испортится, не будет захвачен пиратами и т.д. Такой расчет позволял определять, какую страховую сумму следует выплачивать и какой страховой взнос брать, чтобы это было выгодно для компании.
В 1746 г. профессор философии и права Г. Ахенваль впервые в Марбургском университете начал преподавать новую дисциплину, названную им статистикой. С середины XIX в. благодаря усилиям бельгийца – математика, астронома и статистика А. Кетле (1796–1874) были выработаны правила переписей населения и регулярность их проведения в разных странах. По его инициативе проводились международные статистические конгрессы, а в 1885 году был основан Международный статистический институт. Международной статистикой занимаются такие организации – ООН, ФАО, ЮНЕСКО, МОТ, ЕС, Мировой банк и др. Эти организации занимаются сбором, представлением, сравнением и интерпретацией социально-экономических данных.
Свой вклад в теорию вероятностей внесли А. Муавр, П. Лаплас, К. Ф. Гаусс, С. Пуассон и др. Другой плодотворный период связан с П.Л. Чебышевым, А.А. Марковым, А.М. Ляпуновым.
В это время теория вероятностей становится стройной математической наукой. Большое влияние на дальнейшее развитие науки связано с русскими математиками С. Н. Берштейном, В.И.
Романовским и А.Н. Колмогоровым.
Событие (явление) – возможный исход испытания, опыта, наблюдения.
Все наблюдаемые нами явления можно условно разделить на три вида: достоверные, невозможные и случайные.
Достоверным называется событие, которое обязательно произойдет, если будут выполнены определенные условия. Например, если в сосуде находится вода, давление атмосферы нормальное, а температура воздуха 30С, то событие «вода в сосуде находится в жидком состоянии».
Невозможным называется событие, которое заведомо не произойдет, если будет выполнена совокупность условий S. Например, при нагревании олова и меди вы не сможете получить золото.
Случайным называют событие, которое при осуществлении условий S может произойти, а может и не произойти. Например, при бросании монеты выпадение герба – является случайным событием, потому что оно может произойти, а может и не произойти.
Каждое случайное событие есть следствие действия очень многих сил и случайных причин, которые учесть просто невозможно. В нашем случае это сила броска, вес и размер монеты, ее симметричность, состояние здоровья человека, бросившего монету и т.д. Поэтому теория вероятностей не ставит себе задачу предсказать, произойдет или нет единичное случайное событие – она просто не в силах это сделать. Однако, когда речь идет о случайных событиях, которые многократно наблюдаются при осуществлении одних и тех же условий S, то есть происходят массовые однородные случайные события, то оказывается что они подчиняются определенным закономерностям. Эти закономерности называются вероятностными.
Например, выпадение снега в Москве 10 октября является случайным событием. Ежедневный восход Солнца можно считать достоверным событием, а выпадение снега на экваторе – невозможным событием.
Предметом теории вероятностей является изучение вероятностных закономерностей массовых однородных случайных событий.
Знание закономерностей, которым подчиняются массовые события позволяет предвидеть, как эти события будут протекать. Например, нельзя заранее определить результат одного бросания монеты, но можно предсказать, причем с небольшой погрешностью, число выпадений «орла» или «решки», если монета будет брошена большое число раз в одних и тех же условиях.
Прежде чем мы введем основные понятия, теоремы, следствия теории вероятностей, попробуем рассмотреть общие принципы построения математических дисциплин. Теория вероятностей – математическая дисциплина, родственная таким дисциплинам, как, например, геометрия или теоретическая механика.
В каждой изучаемой дисциплине, как правило, существуют три аспекта:
а) формально-логическое содержание, б) интуитивные представления, в) приложения.
Характер дисциплины в целом и перспективы ее применения нельзя по-настоящему оценить, не рассматривая эти три аспекта в их взаимосвязи.
Формально-логическое содержание. Характерной особенностью математики является то, что она занимается исключительно соотношениями между неопределяемыми вещами. Невозможно “определить” шахматы иначе, как сформулировав систему правил игры. Аналогично этому геометрия не беспокоится о том, чем “на самом деле” являются точки и прямые. Они остаются неопределяемыми понятиями, и аксиомы геометрии лишь устанавливают связи между ними. Это правила игры, и в них нет ничего таинственного. Формально-логическое содержание статистики представляет собой совокупность понятий, общих представлений и закономерностей окружающего нас мира.
В основе дисциплины лежат свои аксиомы и теоремы, которые являются фундаментом статистики.
Интуитивные представления. Каждый приобретает интуитивное представление о смысле самых разных понятий. Эта интуиция является достаточной предпосылкой для первых формальных правил теории вероятностей.
Приложения. Приложения теории вероятностей и математической статистики весьма обширны. Знания, полученные в результате статистического анализа явлений окружающего нас мира, применяются в экономике, политике, промышленности и других областях деятельности людей. Используются эти данные для изучения реальных процессов, а также эффективного управления ими и прогнозирования.
Основные определения вероятности В отличие от математических дисциплин, изучающих “точные” закономерности, предметом теории вероятностей являются специфические закономерности, наблюдаемые при анализе случайных явлений. Эти закономерности проявляются в массовых явлениях, и позволяют предсказывать с той или иной вероятностью исход испытаний. Тогда как, в единичном случае можно только предположить исход события.
Мы можем наблюдать широкий круг явлений, когда при многократном осуществлении комплекса условий доля той части случаев, когда событие А происходит, лишь изредка уклоняется сколько-нибудь значительно от некоторой средней цифры, которая таким образом может служить характерным показателем массовой операции (многократного повторения комплекса ) по отношению к событию А. Закономерности этого рода называются вероятностными или стохастическими закономерностями.
Итак, имеется схема для различных событий, наступающих при неизменном комплексе условий: достоверное – случайное – невозможное. Ясно, что большая часть событий в мире находится между достоверностью и невозможностью (интуитивное понимание!).
По мере развития теории вероятностей, а также областей её приложения, развивались и представления об основном понятии этой теории – вероятности.
В настоящее время существует четыре подхода к определению вероятности:
1. Определение математической вероятности как количественной меры “степени уверенности” познающего объекта.
2. Определения, сводящие понятие вероятности к понятию “равновозможности” как к более примитивному понятию (так называемое “классическое” определение вероятности).
3. Определения, основанные на “частоте” появления события в большом количестве испытаний (“статистическое” определение).
4. Аксиоматический подход, на основе теории множеств, формализующий теорию вероятностей.
Вероятностью события P(А) называют отношение числа благоприятных исходов испытания m к общему числу всех равновозможных несовместных элементарных исходов n:
Это определение вероятности базируется на классическом подходе и часто применяются для решения конкретных задач, поэтому мы часто будем обращаться к нему далее. Остановимся подробнее на аксиоматическом подходе к определению вероятности события.
Аксиоматическое определение вероятности Прежде, чем рассмотреть вероятность с указанной позиции, вспомним, что аксиома – это исходное утверждение какой-либо научной теории, которое берется в качестве недоказуемого, и из которого выводятся все остальные предложения теории по принятым в ней правилам вывода.
Построение аксиом теории вероятностей А.Н. Колмогоровым означало переход от полуэмпирического, интуитивного понимания вероятности к строгому формализованному. Для введения аксиом нам необходимо принять следующие соглашения.
Зафиксируем комплекс условий и рассмотрим некоторую систему S событий А, В, С,..., каждое из которых должно при каждом осуществлении комплекса произойти или не произойти. Далее введём соглашения, которые, как увидит внимательный читатель, являются соглашениями теории множеств и математической логики.
1) Событие, состоящее в наступлении обоих событий А и В, будем называть произведением событий А и В и обозначать АВ (или АВ).
2) Событие, состоящее в наступлении хотя бы одного из событий А и В, будем называть суммой событий А и В и обозначать А+В (или АВ).
3) Событие, состоящее в том, что событие А происходит, а событие В не происходит, будем называть разностью событий А и В и обозначать А – В.
4) Если при каждом осуществлении комплекса условий, при котором происходит событие А, происходит и событие В, то мы будем говорить, что А влечет за собой В, и обозначать это символом А В или В А.
5) Если А влечет за собой В и в то же время В влечет за собой А, то есть если при каждой реализации комплекса условий события А и В оба наступают или оба не наступают, то мы будем говорить, что события А и В равносильны, и обозначим это А=В. Равносильные события могут заменять друг друга или, по-другому, они тождественны.
6) Два события А и А называются противоположными, если для них одновременно выполняются два соотношения:
7) А+ А = U (достоверное событие), А* А = V (невозможное событие) Пусть U – достоверное событие. Все достоверные события равносильны между собой.
V – невозможное событие. Все невозможные события тоже равносильны между собой.
8) Два события А и В называются несовместимыми, если их совместное появление невозможно, то есть если А*В = V.
Если А=В1+В2+...+ВN и события Вi попарно несовместимы, то есть ВiBj = V при i j, то говорят, то событие А подразделяется на частные случаи В1, В2,..., Вn. Например, при бросании игральной кости событие С, состоящее в выпадении четного числа очков, подразделяется на частные случаи Е2, Е4 и Е6, состоящие соответственно в выпадении 2, 4 и 6 очков.
События В1, В2,..., ВN образуют полную группу событий, если хотя бы одно из них непременно должно произойти (при каждом осуществлении комплекса ), то есть если В1+В2+...+ВN = Пример. В порту имеется два причала для приема судов.
Можно рассмотреть три события: В1 – отсутствие судов у причалов, В2 – присутствие одного судна у одного из причалов, В3– присутствие двух судов у двух причалов. Эти три события образуют полную группу.
В каждой задаче теории вероятностей приходится иметь дело с каким-либо определенным комплексом условий и с какой-либо определенной системой S событий, наступающих или не наступающих после каждой реализации комплекса условий. Относительно этой системы целесообразно сделать следующие допущения:
а) если системе S принадлежат события А и В, то ей принадлежат также события АВ, А+В, А-В (замкнутость относительно операций);
б) система S содержит достоверное и невозможное события (“единица” и “ноль” в замкнутой системе).
Система событий, удовлетворяющая этим допущениям (1называется полем событий.
Всегда можно выделить такие события, которые не могут быть разложены на более простые: выпадение определенной грани при бросании игральной кости, попадание в определенную точку квадрата при рассмотрении диаграммы Венна (рис.1).
Назовем такие неразложимые события – элементарными событиями.
Рис. 1. Диаграммы Венна, описывающие события A и B, Для построения математической теории вероятностей требуется дополнительная формализация.
Введем понятие – пространство элементарных событий, которое состоит из множества всех возможных элементарных событий. Элементами пространства могут быть точки евклидова пространства, функции одной или нескольких переменных и т.
д. Множество точек пространства элементарных событий образуют случайные события. Имеется в виду любая доступная комбинация из элементарных событий, полученная в результате легальных операций. Событие, состоящее из всех точек пространства элементарных событий, называется достоверным событием.
Для пространства элементарных событий, определенных выше указанным способом, имеют место следующие законы, пришедшие из алгебры (табл. 1).
Законы пространства элементарных событий ассоциативный А+(В+С)= =(А+В)+С А(ВС) = (АВ)С Столь долгая процедура потребовалась, чтобы перейти на язык теории множеств и формальной алгебры. Следующим шагом будет выделение условий для ввода аксиом теории вероятностей.
Пусть задано некоторое множество. Элементы этого множества называются элементарными событиями. Предположим, что фиксирована некоторая система подмножеств множества ; эти подмножества названы просто событиями. События обозначаются А, В, С и так далее. При этом потребуем, что:
I. Само множество есть событие;
II. Если А – событие, то А - тоже событие; здесь символ А обозначает дополнение к подмножеству А в ;
III. Если А1, А2,... события, то и А1+А2+..., а также А1А2... – снова события. Под А1+А2+... понимается объединение всех подмножеств А1, А2,..., а под А1А2... – их пересечение.
Таким образом, если строго следовать теоретикомножественному подходу, мы задаем алгебру событий на множестве. -алгебра событий является системой подмножеств пространства элементарных исходов, замкнутая относительно конечного числа теоретико-множественных операций.
Число подмножеств Аi может быть конечным и бесконечным.
Множество называют пространством элементарных событий.
Два события А и В, не имеющие (как два подмножества) общих элементов, называются несовместными.
События А и А называются противоположными.
Событие называется достоверным, событие (то есть пустое множество) – невозможным.
Аксиомы Колмогорова, задающие понятие вероятности:
Аксиома 1. Каждому событию А поставлено в соответствие неотрицательное число р(А), называемое вероятностью события Аксиома 2. Если события А1, А2,... попарно несовместны, то вероятность наступления хотя бы одного из них равна сумме вероятностей этих событий.
р(А1+А2+...+ Аn )= р(А1) + р(А2) +... р(Аn).
Для случая, когда пространство конечно (аксиома 2), может быть заменено более слабым требованием:
р(А+В) = р(А) + р(В), если А и В несовместны.
Аксиома 3. Р() = 1. Вероятность полной группы событий равна 1.
Приобретены два билета денежно-вещевой лотереи. Обязательно произойдет одно и только одно из следующих событий: «выигрыш выпал на первый билет и не выпал на второй», «выигрыш не выпал на первый билет и выпал на второй», «выигрыш выпал на оба билета», «на оба билета выигрыш не выпал». Эти события образуют полную группу попарно несовместных событий.
Стрелок произвел выстрел по цели. Обязательно произойдет одно из следующих двух событий: попадание, промах. Эти два несовместных события образуют полную группу. Все теоремы теории вероятностей выводятся из аксиом 1-3.
Задача 1. Из колоды игральных карт, содержащей 36 листов, наугад выбирается одна карта. Найти вероятность того, что:
а) карта окажется красной масти; б) карта окажется картинкой;
в) карта окажется дамой; г) эта карта туз буби.
Решение.
а) n = 36, m = 18; P(A) = 18/36=1/2.
б) n = 36, m = 16; P(A) = 16/36=4/9.
в) n = 36, m = 4; P(A) = 4/36=1/9.
Задача 2. Пусть вероятность того, что студент получит на экзамене по статистике «пятерку» равна 0,17, «четверку» – 0,38, «тройку» – 0,32, а «двойку» – 0,13. Найти вероятность того, что очередной студент получит оценку, не меньше тройки.
Решение. Искомое событие D произойдет, если будет получена оценка 5 (событие А), оценка 4 (событие В), или оценка (событие С), то есть событие D есть сумма событий А, В, С. События А, В и С несовместимы. Поэтому, применяя теорему сложения вероятностей, получим:
P(D) = P(A+B+C) = P(A) + P(B)+ P(C) = 0,17 + 0,38 + 0,32= Задача 3. Испытатель проводит опыты с пирамидкой, подбрасывая ее и определяя какая грань выпадет при очередном испытании. В результате опытов были определены вероятности выпадения каждой из четырех граней: 1/3, 1/6, 1/3, 1/6. Определите вероятность полной группы событий.
Решение. Вероятность полной группы событий определяется как сумма вероятностей всех элементарных исходов данной группы:
Р() = P(A) + P(B)+ P(C)+ P(D)= 1/3+1/6+1/3+1/6=1.
Следствие 1. Вероятность достоверного события равна единице. Действительно, если событие достоверно, то каждый исход испытания благоприятствует событию, то есть m=n, а значит и его вероятность P(A)=m/n=1.
Следствие 2. Вероятность невозможного события равна нулю. Раз ни один из исходов испытания не благоприятствует событию, то m=0, а тогда P(A)=m/n=0.
Следствие 3. Вероятность случайного события есть положительное число, заключенное между 0 и единицей. Поскольку случайному событию благоприятствует лишь часть из общего числа элементарных исходов испытания. То есть 0 b.
Основные характеристики распределения:
Вероятность попадания равномерно распределенной случайной величины на интервал (x1, x2), лежащий внутри отрезка (a,b), равна F(x2)-F(x1)=(x2-x1)/(b-a), то есть пропорциональна длине этого интервала. Равномерное распределение реализует принцип геометрической вероятности при бросании точки на отрезок (a,b).
Рис. 15. Принцип геометрической вероятности при бросании точки на отрезок (a,b) Случайная величина подчиняется экспоненциальному (показательному) закону, если она имеет функцию распределения:
Плотность экспоненциального распределения можно получить интегрированием функции распределения:
Рис. 16. Плотность и функция экспоненциального распределения Экспоненциально распределенная случайная величина может принимать только положительные значения. Экспоненциальному распределению подчинено время распада атомов различных элементов. При этом число Т = 1/ носит название среднего времени распада. Кроме того, употребляется также число T0 = ln2/ – называемое периодом полураспада.
Экспоненциально распределенная случайная величина обладает свойством – отсутствием последействия. Это можно трактовать как независимость поведения случайной величины в момент времени x+x от того, что с ней произошло до этого.
Основные характеристики распределения:
Случайная величина распределена по нормальному или гауссову закону, если она имеет плотность распределения Нормальное распределение зависит от двух параметров: где m – математическое ожидание или среднее значение нормального закона; - среднее квадратичное отклонение (рис. 17).
Рис. 17. Графики плотности и функции нормального распределения Графики для плотности распределения с одинаковым средним арифметическим и различными среднеквадратическими отклонениями. Плотность нормального распределения зависит от значений среднего арифметического и среднеквадратичного отклонения (рис. 18).
Рис. 18. Зависимость плотности нормального распределения от Параметр m определяет положение центра нормальной плотности, а – разброс относительно центра. Если m=0, = 1, то такой нормальный закон называется стандартным и его функция распределения обозначается через Ф(х).
Основные характеристики распределения:
Нормальное распределение возникает обычно в явлениях, подверженных действию большого числа “малых” случайных воздействий.
Случайная величина распределена по закону Вейбулла, если она имеет плотность распределения Семейство распределений Вейбулла является двухпараметрическим и описывает положительные случайные величины (рис.19). Считается, что распределению Вейбулла подчиняются времена безотказной работы многих технических устройств. Если =1, то распределение Вейбулла превращается в экспоненциальное распределение, а если =2 – в так называемое распределение Релея.
Рис. 19. Семейство функций и плотностей распределения Другим распределением, также достаточно хорошо описывающим времена безотказной работы различных технических устройств, является гамма-распределение с плотностью:
где ( ) x e dx – гамма-функция Эйлера. Свойства гамма-функции: Г(+1) = Г() и Г(n) = (n-1)! Для целых n. Функция и плотность Гамма-распределения представлены на рис. 20.
Рис. 20. Семейство функций и плотностей Гаммараспределения Если = k/2 – полуцелое, а = 1/2, то гамма-распределение превращается в так называемое распределение 2(хи-квадрат).
Параметр k – называется в этом случае числом степеней свободы распределения 2.
Для дальнейшего развития понятия – случайная величина, следует перейти к понятию – функция от случайной величины.
Пусть на вероятностном пространстве (,, Р) задана случайная величина = (). Возьмем обычную (измеримую) числовую функцию g(x) числового аргумента х. Сопоставляя каждому элементарному исходу число () по формуле ()=g(()), получим новую случайную величину, которую назовем функцией g() от случайной величины.
Функция = g() от дискретной случайной величины также является дискретной случайной величиной, поскольку она не может принимать больше значений, чем случайная величина.
Ряд распределения случайной величины = g() можно представить таблицей:
При этом, если в верхней строке таблицы появляются одинаковые значения g(Xi), то соответствующие столбцы надо объединить в один, приписав им суммарную вероятность.
Функция = g() от непрерывной случайной величины может быть как непрерывной, так и дискретной (дискретной она