ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
Государственное образовательное учреждение
высшего профессионального образования
«ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»
УТВЕРЖДАЮ
Директор ИДО
А.Ф. Федоров «» _2007 г.
ТЕОРИЯ ВЕРОЯТНОСТЕЙ И
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Рабочая программа, методические указания и контрольные задания для студентов направления 080100 «Экономика» и специальностей 080109 «Бухгалтерский учет, анализ, аудит», 080103 «Национальная экономика», 010502 «Прикладная информатика (в экономике)»Института дистанционного образования Издание второе, переработанное и дополненное Семестр 2(4) 3(5) Лекции, часов 2 10(8) Практические занятия, часов Контрольная работа Самостоятельная работа, часов 110(94) Форма контроля зачет Томск УДК 519.21(075.8) Теория вероятностей и математическая статистика: рабочая программа, методические указания и контрольные работы для студентов направл. «Экономика» и спец. 080109 «Бухгалтерский учет, анализ, аудит», «Национальная экономика», 010502 «Прикладная информатика (в экономике)» ИДО / Сост. Л.И. Константинова. – 2-е изд., перераб. и доп. – Томск:
Изд. ТПУ, 2007. – 52 с.
Рабочая программа, методические указания и контрольные задания рассмотрены и рекомендованы к изданию методическим семинаром кафедры прикладной математики 16 мая 2006 г.
Зав. кафедрой, профессор, д. ф.-м. н. _ В.П. Григорьев Аннотация Рабочая программа, методические указания и контрольные задания по дисциплине «Теория вероятностей и математическая статистика»
предназначены для студентов направления 080100 «Экономика» и специальностей 080109 «Бухгалтерский учет, анализ, аудит», 080103 «Национальная экономика», 010502 «Прикладная информатика (в экономике)» ИДО ТПУ.
Приведено содержание основных тем дисциплины, указаны темы практических занятий. Приведены варианты заданий контрольной работы. Даны методические указания по выполнению контрольной работы.
1. ЦЕЛИ И ЗАДАЧИ ИЗУЧЕНИЯ ДИСЦИПЛИНЫ
1.1. Цели преподавания дисциплины Дисциплина «Теория вероятностей и математическая статистика» является общепрофессиональной и предназначена для студентов, обучающихся по направлению 080100 «Экономика» и по специальностям 080109 «Бухгалтерский учет, анализ, аудит», 080103 «Национальная экономика», «Прикладная информатика (в экономике)».Практически все сферы деятельности, включая бизнес, экономику, социологию используют статистические методы для принятия решений.
Цель изучения данной дисциплины для студентов указанных направлений определяется больше требованием овладения практического применения статистических методов, чем изучением его в строго формализованном виде на основе теории мер. Поэтому данный курс включает в себя изложение основополагающих разделов математической статистики и теории вероятностей, которые формируют у студентов определенное вероятностное мышление и дают навыки применения статистических методов.
1.2. Задачи изучения дисциплины В результате изучения дисциплины студенты должны знать:
основные формулы для определения вероятности события;
основные законы распределения случайных величин и их числовые характеристики;
способы представления результатов наблюдений;
методы оценивания генеральных параметров по выборке;
общий алгоритм решения задач по проверке гипотез;
способы оценивания стохастической связи и определения зависимости между переменными.
В результате изучения дисциплины студенты должны уметь:
применять вероятностные и статистические методы;
интерпретировать полученные результаты.
1.3. База для изучения дисциплины Теоретической базой для изучения «Теории вероятностей и математической статистики» является дисциплина «Высшая математика».
Рабочая программа составлена на основе типовой программы по дисциплине «Теория вероятностей и математическая статистика».
Основной целью данных методических указаний является организация помощи при выполнении контрольной работы. По данному курсу выпущено достаточное число учебников и учебных пособий. Наиболее подходящие рекомендованы в разделе 5.
2. СОДЕРЖАНИЕ ТЕОРЕТИЧЕСКОГО РАЗДЕЛА ДИСЦИПЛИНЫ
2.1.1. Вероятность случайных событий Основные формулы. Случайные события и их классификация. Понятие выборочного пространства. Классическое определение вероятности. Комбинаторный метод. Вероятностные матрицы. Условная вероятность. Формулы сложения и умножения. Независимость событий. Формула полной вероятности. Формула Байеса.Контрольные вопросы 1. Что изучает теория вероятностей?
2. Что такое элементарное событие?
3. Что такое выборочное пространство?
4. Что такое случайное событие?
5. Классическое определение вероятности. Основные формулы комбинаторики. Вероятностные матрицы.
6. Статистическое определение вероятности.
7. Какие события называются достоверными, невозможными, несовместными?
8. Что такое сумма событий, произведение событий?
9. Какое событие называется противоположным?
10. Что такое условная вероятность, 11. Какие события называются независимыми?
12. Формула вероятности суммы двух событий, если эти события несовместны 13. Формула вероятности суммы двух событий, если эти события совместны 14. Формула вероятности произведения двух событий, если эти события независимы.
15. Формула вероятности произведения двух событий, если эти события зависимы.
16. Формула полной вероятности.
17. Формула Байеса.
2.1.2. Законы распределения случайных величин Случайные величины (дискретные, непрерывные). Числовые характеристики случайных величин. Моменты. Закон распределения (определение, способы задания) для дискретных и непрерывных случайных величин. Основные законы распределения дискретных случайных величин: биномиальное, распределение Пуассона, геометрическое, гипергеометрическое. Распределение непрерывных случайных величин: нормальное. Практическая интерпретация и формулировка центральной предельной теоремы.
Контрольные вопросы 1. Что такое случайная величина?
2. Какие случайные величины являются дискретными, непрерывными?
3. Что такое закон распределения случайной величины?
4. Что такое функция распределения случайной величины, ее свойства?
5. Как задается закон распределения для дискретных случайных величин?
6. Что такое плотность распределения случайной величины, ее свойства?
7. Как задается закон распределения для непрерывных случайных величин?
8. Что такое математическое ожидание и как оно определяется для случайных величин непрерывного и дискретного типов?
9. Что такое дисперсия, среднеквадратическое отклонение и как они определяются для случайных величин непрерывного и дискретного типов?
10. Что такое начальные и центральные моменты?
11. Как определяется функция распределения стандартизованного нормального закона распределения.
12. Как связаны функция стандартизованного нормального закона распределения и функция Лапласа?
13. В чем состоит эмпирическое правило для нормального закона распределения?
14. Что доказывает центральная предельная теорема?
2.1.3. Эмпирические распределения Представление выборочных данных. Понятие выборки, генеральной совокупности. Классификация данных. Графическое представление. Числовые характеристики. Эмпирические моменты. Вычисление средних, дисперсии стандартного отклонения, эксцесса, асимметрии и их интерпретация.
Мода, медиана.
Контрольные вопросы Что такое выборка, объем выборки?
Что такое генеральная совокупность?
Какого типа могут быть результаты наблюдений?
Какие наблюдения называются непрерывными?
Какие наблюдения называются дискретными?
Что такое вариационный ряд?
Что такое статистический ряд для:
непрерывных наблюдений;
дискретных наблюдений?
8. Как определяется объем выборки по сгруппированному ряду?
9. Как определяется число классов для интервального ряда?
10. Как представляется графически интервальный ряд?
11. Как представляется графически сгруппированный ряд?
12. Как определяется эмпирическая функция распределения?
13. В каком интервале может принимать значения эмпирическая функция распределения?
14. Чему равна площадь гистограммы, построенной в координатах (x, m), где m – частота.
15. Чему равна площадь гистограммы, построенная в координатах (x, m/n), где m/n – частость.
16. Как определяется среднее арифметическое выборки?
17. Как определяется среднее арифметическое сгруппированного ряда, интервального ряда?
18. Как определяется выборочная дисперсия:
19. Как определяется выборочное среднее квадратическое отклонение?
20. С помощью каких числовых характеристик можно установить симметричность распределения?
21. Какие числовые характеристики относятся к структурным средним?
22. Как определяется мода?
23. Как определяется медиана?
24. Какие числовые характеристики являются характеристиками расположения?
25. Какие числовые характеристики являются характеристиками рассеивания?
26. Как определяется коэффициент вариации?
27. Влияют ли крайние члены вариационного ряда на медиану, среднее арифметическое?
28. Что такое n – процентиль?
29. Как определяются квартили?
2.1.4. Оценка параметров распределения Требования к оценкам параметров (состоятельность, несмещенность, эффективность). Точечное оценивание параметров нормального распределения. Способы моментов. Интервальные оценки. Понятие доверительной вероятности, уровня значимости, доверительного интервала. Интервальное оценивание параметров нормального распределения. Определение объема выборки.
Контрольные вопросы 1. Какие типы оценок используются в математической статистике?
2. Какие параметры имеет нормальный закон распределения?
3. Что является точечной оценкой для математического ожидания?
4. Что является точечной оценкой для дисперсии?
5. Что такое доверительный интервал?
6. Что такое уровень значимости?
7. Что такое доверительная вероятность?
8. Как доверительная вероятность связана с уровнем значимости?
9. Как задается уровень значимости?
10. Какие условия влияют на выбор формулы для определения доверительной оценки для математического ожидания?
11. Формулы для интервального оценивания математического ожидания.
2.1.5. Проверка статистических гипотез Примеры основных задач проверки гипотез. Нулевая и альтернативная гипотезы. Критерий принятия решений односторонний и двусторонний. Критическая область. Ошибки 1-го и 2-го рода. Параметрические и непараметрические критерии проверки статистических гипотез. Проверка гипотез о значениях двух средних и двух дисперсий из нормально распределенных генеральных совокупностей. Проверка гипотезы о законе распределения.
Контрольные вопросы 1. Какие гипотезы выдвигаются в задачах проверки гипотез?
2. Как формулируется нулевая гипотеза?
3. Как формулируется альтернативная гипотеза?
4. Что такое ошибка 1-го рода?
5. Что такое ошибка 2-го рода?
6. Как определяются вероятности ошибок 1-го и 2-го рода?
7. Если вероятность ошибки 1-го рода уменьшается, то что происходит с вероятностью ошибки 2-го рода?
8. Что такое критическая точка?
9. Что такое критическая область?
10. Что такое критерий для проверки гипотез?
11. В каком случае отвергается нулевая гипотеза?
12. В каком случае принимается нулевая гипотеза?
13. Критерий принятий нулевой гипотезы при сравнении двух средних.
14. Критерий принятий нулевой гипотезы при сравнении двух дисперсий.
2.1.6. Основные положения корреляционно – регрессионного анализа Понятие стохастической связи между случайными величинами. Корреляционный момент (ковариация). Определение коррелированных и некоррелированных случайных величин. Корреляционная таблица, корреляционное поле. Выборочный парный коэффициент корреляции. Значимость и надежность коэффициента корреляции. Парная линейная регрессия. Уравнение регрессии. Оценивание коэффициентов регрессии. Адекватность (линейность) регрессии. Степень согласованности эмпирическим данным.
Контрольные вопросы 1. Что такое стохастическая связь между случайными переменными?
2. Как можно оценить стохастическую связь?
3. Что оценивает выборочный коэффициент корреляции?
4. Что оценивает ранговый коэффициент корреляции?
5. Как определяется значимость коэффициента корреляции?
6. Что называется регрессией у на х?
7. Как задается парная линейная регрессия?
8. Какой метод используется для оценки коэффициентов парной линейной регрессии?
9. Как определяются коэффициенты парной линейной регрессии?
10. Как оценивается качество аппроксимации результатов наблюдений регрессионной моделью?
3. СОДЕРЖАНИЕ ПРАКТИЧЕСКОГО РАЗДЕЛА ДИСЦИПЛИНЫ
1. Решение задач проверки статистических гипотез (2 часа).2. Решение задач корреляционно-регрессионного анализа (2 часа).
4. КОНТРОЛЬНАЯ РАБОТА
Контрольная работа имеет 11 заданий (5 по теории вероятностей и 6 по математической статистике) по 10 вариантов на каждое задание. Студент выполняет тот вариант, который совпадает с последней цифрой его учебного шифра. При оформлении контрольной работы необходимо выполнять следующие правила:работу нужно выполнять в отдельной тетради, на обложке которой должны быть указаны фамилия и инициалы студента, его полный шифр, номер контрольной работы, дата отправки в университет;
задачи оформляются в порядке номеров, указанных в задании, при этом записывается условие задачи и к решению прилагаются пояснения, которые должны быть подробными и написаны без сокращений;
если работа выполнена неудовлетворительно, то вместе с рецензией ее возвращают студенту. Студент должен в короткий срок сделать необходимые доработки и послать на повторное рецензирование. При необходимости студент должен давать пояснения по всем или некоторым задачам контрольной работы.
4.2. Контрольные задания по теории вероятностей 1. Определить вероятность случайных событий по классическому определению вероятности.
2. Определить вероятности сложных событий, используя формулы сложения и умножения вероятностей.
3. Установить, являются ли случайные события независимыми, используя понятие условной вероятности.
4. Определить вероятности случайных событий, используя формулу полной вероятности и формулу Байеса.
5. Определить закон распределения случайной величины (СВ), ее числовые характеристики и вероятность попадания в заданный промежуток.
Методические указания к выполнению контрольных заданий и Случайным событием называется событие, которое в результате эксперимента может произойти или не произойти. При этом рассматриваются только такие эксперименты, которые можно повторять, при неизменном комплексе условий, произвольное число раз.
Результатом эксперимента является случайный исход или элементарное событие еi. Все возможные элементарные исходы образуют выборочное пространство E e i, где i = 1, …, n. Случайное событие может совпадать со случайным исходом эксперимента или являться какой-либо комбинацией этих исходов. Если случайное событие обозначить А, а все возможные исходы эксперимента e i, то каждому случайному событию А будет благоприятствовать какое-то число элементарных событий (исходов) e i (ими будут e i, через которые можно определить случайное событие А).
Классическое определение вероятности случайного события А используется для экспериментов со случайными исходами e i (элементарными событиями), которые можно повторять (воспроизводить) при неизменном комплексе условий произвольное число раз и при этом каждый раз любой исход e i имеет один и тот же шанс появиться. В этом случае вероятность любого события А, являющегося комбинацией e i, определяется по следующей формуле:
где m число элементарных исходов e i, которые благоприятствуют появлению А, и n – число всевозможных исходов.
Пример. Эксперимент состоит в подбрасывании один раз правильной шестигранной игральной кости. Пусть х – число очков, выпавших на верхней грани кости. Описать множество всех элементарных событий, и указать состав подмножеств, соответствующих событиям А = {х кратно 3}, В = {х нечетно}, С = {x > 3}. Определить вероятности случайных событий А, В, С.
Решение. Множество всех возможных случайных исходов составляют элементарные события, состоящие в выпадении e 1 1, e 2 2, e 3 3, e 4 4, e 5 5, e 6 6. Событиям А, В, С соответствуют подмножества из { e i }, в которые входят следующие исходы:
1. Игральная кость подбрасывается два раза. Найти вероятность события А – сумма очков равна 6, D – сумма очков меньше 5.
2. Подбрасывается две игральных кости. Отмечается число очков на верхних гранях. Что вероятнее: получить число очков, в сумме дающих 7 или получить одинаковое число очков на обеих костях?
3. Подбрасываются две игральные кости, подсчитывается сумма очков на верхних гранях. Что вероятнее: получить в сумме 7 или 8.
4. Монета подбрасывается два раза. Определить вероятность того, что появится не более двух гербов.
5. Монета подбрасывается два раза. Определить вероятность того, что появится хотя бы одна решка.
6. Среди 500 пассажиров метрополитена 240 мужчин. Определить вероятность того, что первым выбранным для интервью пассажиром окажется женщина.
7. В денежно-вещевой лотерее на каждые 1000 билетов 5 денежных и 25 вещевых выигрышей. Какова вероятность выигрыша на 1 билет?
8. В ящике 250 яиц, из которых 20 бракованных. Какова вероятность того, что первое взятое из ящика не окажется бракованным?
9. В группе 17 юношей и 8 девушек. Какова вероятность, что студент, фамилия которого в списке группы находится на 1-ом месте, окажется девушкой.
10. В урне 23 шара: 10 синих, 5 желтых и 8 белых. Что более вероятно извлечение желтого шара или появление 5 очков при бросании игральной кости.
4.2.2. Комбинаторный метод вычисления вероятностей Предполагается, что производится выбор m элементов из n различных элементов всех возможных исходов E {e1, e 2,...,e n }. При этом предполагается, что выбор осуществляется без возвращения. Это предполагает, что выбираются сразу все m элементов из n, или по одному, причем каждый выбранный исключается. В результате имеем различные схемы по выбору m элементов из общего числа исходов E.
1. Схема выбора, приводящая к сочетаниям Если опыт состоит в выборе m элементов без возвращения и упорядочивания, то различными исходами будут сочетания из n элементов по m.
Их общее число определяется по формуле Пример. В урне 10 белых и 5 черных шаров. Из урны вынимают 2 шара. Определить вероятность того, что оба шара будут белыми.
Решение. Событие А – оба шара будут белыми.
Пример. Ящик содержит 6 деталей, среди которых 2 детали неисправны, 4 детали исправны. Три из шести деталей выбираются из ящика.
а. Какое количество элементарных исходов мы имеем в данном случае?
б. Какова вероятность, что одна из 3-х деталей будет неисправна?
Число благоприятных исходов в данном случае определяется как произведение числа комбинаций для выбора одной неисправной детали из двух и числа комбинаций для выбора остальных двух деталей из трех исправных.
2. Схема выбора, приводящая к размещениям Если опыт состоит в выборе m элементов без возвращения, но с упорядочиванием их по мере выбора, в последовательную цепочку, то различными исходами будут m элементарных подмножеств множества Е, отличающиеся либо набором элементов, либо порядком их следования. Получаемые при этом комбинации называются размещениями из n элементов по m, а их общее число определяется формулой Пример. На пяти карточках написаны цифры от 1 до 5. Опыт состоит в случайном выборе трех карточек и раскладывании их в порядке поступления в ряд слева направо. Найти вероятность события А = {появится число 123}.
гоприятных исходов 1, т.е. Р(А)=1/60.
В частном случае упорядочивания, когда n = m имеем A m n! или число перестановок Pn из n элементов, где Pn 1 2... n n!
Пример. Из урны, содержащей n перенумерованных шаров, наугад вынимаются один за другим все находящиеся в ней шары. Найти вероятность того, что номера вынутых шаров будут идти по порядку 1, 2, …, n.
Решение. Общее число случаев n n!. Благоприятных случаев m = 1, Примечание: 0! = 1.
1. Буквы а, а, в, к, к, о, х написаны на отдельных карточках. Какова вероятность того, что, извлекая эти карточки по одной наудачу (без возвращения обратно) мы получим в порядке их выхода слово «каховка»?
2. Из полной колоды карт (52 карты) вынимаются наугад 3 карты (без возврата). Вычислить вероятность того, что среди вынутых карт будет точно один туз.
3. Из партии, содержащей 10 изделий, среди которых 3 бракованных наудачу извлекают 3 изделия для контроля. Определить вероятность того, что в полученной выборке нет ни одного бракованного.
4. В группе 25 студентов. Вызываются во время занятий 3 студента.
Полагая, что вызов производится случайно, определить, какова вероятность того, что будут вызваны 3 студента А, В, С в определенном порядке.
5. Студент знает ответы на 15 из 25 вопросов. Какова вероятность того, что из 3 выпавших ему вопросов только два счастливых.
6. В коробке 15 папирос, одинаковых по внешнему виду, но отличающихся сортом табака, а именно: 10 папирос сорта А и 5 папирос сорта Б. Из коробки берут наудачу шесть папирос сразу. Какова вероятность того, что среди этих шести папирос четыре папиросы сорта А и две папиросы сорта Б.
7. Множество Е состоит из 10 первых букв русского алфавита. Опыт состоит в выборе без возвращения четырех букв в записи слова. Сколько слов (из 4-х букв) может быть получено в данном опыте. Какова вероятность, что наудачу составленное слово будет оканчиваться буквой а?
8. Ребенок играет с буквами разрезной азбуки Б, И, И, И, Л, С, Т. Какова вероятность того, что раскладывая эти буквы в ряд, он получит слово «ТБИЛИСИ»?
9. Имеем 10 кандидатов на 3 различные должности. Какова вероятность того, что кандидаты А, В, С получат необходимые им должности.
10.Компания имеет 20 работников. 6 из них должны быть выбраны для интервью. Определить вероятность того, что среди них будет 2 женщины, если всего в компании работает 8 женщин.
Сложным событием называется событие, выражаемое через другие наблюдаемые события в том же эксперименте с помощью допустимых алгебраических операций. Допустимыми алгебраическими операциями над случайными событиями являются сложение, умножение, дополнение, разность.
Суммой двух событий А и В является событие С, которое состоит в появлении хотя бы одного из А и В.
Произведением событий А и В является событие С, состоящее в совместном осуществлении А и В.
Дополнение A A - противоположное событие, где - событие, которое происходит всегда, т.е. Р() = 1, событие называется достоверным событием.
Разность А – В - событие С, состоящее в том, что событие А происходит, а событие В не происходит.
Событие называется невозможным и его вероятность Р() = 0.
События А и В называются несовместными, если появление события А исключает появление события В.
Операции над событиями помогают упростить вычисление вероятностей событий.
Формула сложения вероятностей Р(А+В)=Р(А)+Р(В)-Р(АВ), если А и В совместны, Р(А+В)=Р(А)+Р(В), если А и В несовместны.
Пример. В урне 12 белых и 7 черных шаров. Из урны вынимается 2 шара. Какова вероятность получить один черный шар и один белый шар?
Решение. Пусть А событие – вытащили один белый шар и один черный шар. Событие А произойдет, если произойдут следующие события:
В – в первый раз извлечен белый шар, во второй черный или С - в первый раз извлечен черный шар, во второй белый.
Событие А можно представить как сумму событий В и С, т.е. А=В+С.
События В и С несовместны, значит Условная вероятность. Независимость событий Условная вероятность это вероятность события А при условии, что появилось событие В. Условная вероятность события А при условии, что произошло событие В обозначается как Р(А/В).
Условная вероятность определяется как отношение вероятности совместного появления событий А и В к вероятности события В:
P(A/B)=P(AB)/P(B). Аналогично определяется условная вероятность события В относительно А. Определение условной вероятности выражает принцип умножения вероятностей: вероятность совместного появления двух событий равна вероятности одного из них, умноженной на условную вероятность другого относительно первого :
Событие А зависит от события В, если Р(А/В)Р(А), т.е, вероятность события А изменяется при появлении события В. Если А не зависит от В, то P(A/B)=P(A).
Пример 1. В урне имеется 5 черных и 7 белых шаров. Опыт состоит в том, что из урны вынимается один шар и регистрируется его цвет, после чего шар возвращается в урну. После перемешивания снова вынимается один шар. Найти вероятность того, что оба раза будет вынут белый шар.
Решение. Пусть событие А появление белого шара в первый раз, событие В появление белого шара во второй раз. Как в первый так и во второй раз благоприятных возможностей вынуть белый шар 7, а общее число возможностей 12. Следовательно, в данном случае Р(А) = Р(В) = 7/12;
Р(А/В) = Р(В/А) = 7/12. Поэтому, события А и В в данном случае независимы.
Пример 2. В условиях предыдущего примера найти вероятность появления двух белых шаров, если белый вынутый шар в урну не возвращается.
Решение. В этом случае при вынимании второго шара имеется 11 случаев, из которых 6 благоприятных при условии, что первый шар - белый.
Следовательно, Р(В/А)=6/11, если первый шар был черным. то P(B/A)=7/12.
Таким образом, появление белого шара во второй раз зависит от того, какой шар был вынут в первый раз, т.е. Р(В/А)Р(В), события А и В в данном случае зависимы. Р(АВ)=7/126/11=7/22, если первый шар белый.
Р(АВ) =7/127/11=49/132, если первый шар черный.
Установить являются ли события зависимыми.
1. Две монеты последовательно бросаются. Рассматриваются события:
А – выпадение герба на первой монете, Е – выпадение хотя бы одной цифры.
Определить являются ли эти события зависимыми.
2. Из колоды карт (52 карты) вынимается одна карта. Событие А – появление туза, событие В – появление карты красной масти. Зависимы ли эти события?
3. Из колоды карт (52 карты) вынимается одна. Событие А – появление туза, событие С – появление бубнового туза. Зависимы ли эти события?
4. При последовательном бросании двух монет определить условные и безусловные вероятности для следующих событий: D – выпадение хотя бы одного герба, F – выпадение герба на второй монете.
5. Из полной колоды карт вынимается одна карта. Рассматриваются события С – появление бубнового туза, В – появление карты красной масти.
Зависимы ли эти события?
6. Брошены две игральные кости. А – число очков на первой делится на 3, В - число очков на второй делится на 3. Являются ли эти события зависимыми?
7. Брошены две игральные кости: А – число очков на первой кости делится на 2, С – сумма очков на первой и второй кости делится на 2. Являются ли эти события А и С зависимыми?
8. Игральная кость брошена два раза. Х1 и Х2 – числа очков, выпавших при этих испытаниях. Рассматриваются события: А1 – Х1 делится на 2, Х2 делится на 3, А2 – Х1 делится на 3, Х2 делится на 2. Установить являются ли А и А2 независимыми.
9. Игральная кость брошена два раза. Х1 и Х2 – числа выпавших очков.
Рассматриваются события А1: Х1 делится на Х2; A2: X2 делится на Х1. Являются ли А1 и А2 зависимыми?
10. Игральная кость бросается два раза. Х1 и Х2 – числа выпавших очков. Рассматриваются события А1: Х1 делится на 2; Х2 делится на 3; A2: X делится на Х2. Являются ли эти события зависимыми?
1. Вероятность попадания в мишень одного стрелка при одном выстреле для первого стрелка равна 0.8, для второго стрелка – 0.85. Стрелки произвели по одному выстрелу в мишень. Считая попадание в цель для отдельных стрелков событиями независимыми, найти вероятность события А – ни одного попадания в цель.
2. В условиях задачи варианта 1 определить вероятность В – ровно одно попадание в цель.
3. В условиях задачи варианта 1 определить вероятность события С – попал первый стрелок.
4. В условиях задачи варианта 1 определить вероятность события D – хотя бы одно попадания в цель.
5. В лаборатории работают два компьютера. Вероятность того, что первый компьютер потребует ремонта в течении месяца равна 0.15. Вероятность, что второй компьютер потребует внимания в течении месяца равна 0.2. Определить вероятность того, что оба компьютера не потребуют внимания в течении месяца.
6. В условиях задачи варианта 5 определить вероятность того, что хотя бы один компьютер потребует внимания в течении месяца.
7. Проводится 3 повторных независимых измерения некоторой физической величины. Вероятность того, что при одном измерении (любом) ошибка выйдет за пределы допуска равна 0,1. Найти вероятность события А – во всех измерениях была достигнута точность.
8. В условиях задачи варианта 7 определить вероятность события В – не более, чем в одном измерении ошибка выйдет за пределы допуска.
9. В условиях задачи варианта 7 определить вероятность события С – по крайней мере в двух измерениях подряд была достигнута заданная точность.
10. Среди товаров, продаваемых супермаркетом 25 % товаров первого сорта и 65 % – высшего сорта. Какова вероятность, что первый из двух выбранных товаров окажется товаром первого сорта?
4.2.4. Формула полной вероятности и формула Байеса Пусть случайное событие А может произойти только с одним из событий H1, …, Hn, попарно несовместных. Тогда вероятность события А может быть определена по формуле Р(А)=Р(Н1)Р(А/Н1)+…+Р(Hn)P(A/Hn). События H1, …, Hn называются гипотезами.
Пример. Имеются три одинаковые урны. В первой а белых шаров и b черных, во второй – с белых и d черных; в третьей только белые шары.
Некто подходит наугад к одной из урн и вынимает из нее один шар. Найти вероятность того, что этот шар белый.
Решение. Н1 - выбор первой урны; H2 - выбор второй урны; H3-выбор третьей урны.
P(A)=P(H1)P(A/H1)+Р(Н2)Р(А/Н2) +Р(Н3)Р(А/Н3);
Формула Байеса имеет вид :
Эта формула для вычисления условной вероятности P(Hi/A) гипотезы Hi после испытания, при котором произошло событие А. Формула Байеса позволяет переоценить вероятности гипотез до испытания (априорные), по результатам уже проведенного опыта.
Пример. Пусть в предыдущем примере некто вынул шар и он оказался белым. Определить вероятность того, что он вынул его из первой урны.
1. Три станка выпускают одинаковые детали. Дневная выработка первого станка составляет 6000 изделий, второго - 1000 изделий, третьего - 3000 изделий. Детали проверяются с точки зрения одного определенного признака, причем первый станок выпускает 10% деталей данного свойства, второй – 8 %, третий -15 %. На складе продукция трех станков смешивается. Какова вероятность выбора из этой суммарной партии детали с определенным свойством ?
2. На предприятии имеется - три станка одного типа. Один из них дает 20 % общей продукции, второй – 30 %, третий – 50 %, При этом первый станок производит 5 % брака, второй 4 %, третий – 2 %. Найти вероятность того, что случайно отобранное негодное изделие выпущено первым станком.
3. В группе 40 стрелков, из них 10 человек стреляют отлично, 20 - хорошо, 6 -удовлетворительно, 4 - плохо. Вероятность попадания в цель при одном выстреле для отличного стрелка равна 0.9, для хорошего – 0.8, для удовлетворительного – 0.6, для плохого – 0.4. Вызывают наугад одного из стрелков. Он производит 1 выстрел. Найти вероятность того, что он попал в цель.
4. Пусть при массовом производстве некоторого изделия вероятность того, что оно окажется стандартным равна 0.95. Для контроля производится проверка стандартности изделия, которая дает положительный результат в 99 % случаев для стандартных изделий и в 3 % случаев для нестандартных изделий. Какова вероятность того, что изделие стандартнее, если оно выдержало упрощенную проверку ?
5. В пирамиде установлены 5 винтовок, из которых 3 снабжены оптическим прицелом. Вероятность того, что стрелок поразит мишень при выстреле из винтовки с прицелом равна 0.95, для винтовки без оптического прицела эта вероятность равна 0.7. Найти вероятность того, что мишень будет поражена, если стрелок произведет один выстрел из наудачу взятой винтовки.
6. В группе 30 спортсменов : 20 лыжников, 6 конькобежцев и 4 бегуна.
Вероятность выполнить норму мастера спорта равна : для лыжника 0.9, для конькобежца 0.8 и для бегуна 0.75. Найти вероятность того, что спортсмен, выбранный наудачу, выполнит норму мастера спорта.
7. Два автомата производят одинаковые детали, которые сбрасываются на общий конвейер. Производительность первого автомата вдвое больше производительности второго. Первый автомат вырабатывает в среднем 60 % деталей отличного качества, а второй – 84 %. Наудачу взятая с конвейера деталь оказалась отличного качества. Найти вероятность того, что эта деталь произведена первым автоматом.
8. В группе из 10 студентов, пришедших на экзамен 3 подготовлены отлично, 4 -хорошо, 2 - посредственно и 1 - плохо. В экзаменационных билетах имеется 20 вопросов. Отлично подготовленный студент знает все 20 вопросов, хорошо подготовленный - может ответитъ на 16 вопросов, посредственный - 10 и плохо подготовленный на 5. Вызванный наугад студент ответил на 3 произвольно заданных вопроса. Найти вероятность того, что он подготовлен отлично.
9. В условиях задачи 8 определить вероятность, что студент подготовлен плохо.
10.Имеется 2 партии деталей по 12 и 10 штук, причем в каждой партии одно изделие бракованное. Изделие взятое из первой партии перекладывается во вторую, после чего выбирается изделие из второй партии. Определить вероятность извлечения бракованного изделия из второй партии.
Случайной величиной (СВ) называется величина X, которая в результате опыта может принимать то или иное значение, причем заранее (до опыта) неизвестное. В теоретико вероятностной схеме случайной величиной называют числовую функцию от элементарных исходов X X(e i ). Следовательно, можно говорить о числовой функции X(e i ), определенной на пространстве элементарных событий. Значения случайных величин обозначаются х, у, z,....
Случайные величины могут быть дискретными и непрерывными.
Дискретной случайной величиной называется величина, которая принимает конечное или бесконечное счетное множество значений.
Непрерывные случайные величины – это величины, значения которых непрерывно заполняют некоторый числовый отрезок.
В качестве примеров можно рассмотреть следующие.
1. Предположим эксперимент состоит в том, что необходимо определить число автомобилей, проезжающих по магистрали за 30 сек.
Возможные значения случайной величины 0, 1, 2, …, n.
2. Предположим, что нужно измерить время завершения двух операций на конвейере. Возможные значения, которые принимает случайная величина от 0 секунд до n секунд.
В первом случае имеем дискретную случайную величину, во втором непрерывную.
Случайная величина считается заданной, если задан ее закон распределения. Законом распределения случайной величины называется всякое соотношение между значениями, принимаемыми случайной величиной и вероятностями, с которыми она принимает эти значения. Закон распределения позволяет полностью описать случайную величину с вероятностной точки зрения.
Для дискретных случайных величин закон распределения задается в виде ряда распределения и функции распределения.
Для непрерывных случайных величин закон распределения задается в виде функции распределения и плотности распределения, которые будут рассмотрены ниже.
Для дискретной СВ закон распределения может быть задан рядом распределения, который представляется таблицей соответствия значений СВ и соответствующих им вероятностей. Ряд распределения может быть также задан графиком, когда по оси х откладываются значения случайной величины, а по у значения вероятностей; ломаная линия, соединяющая точки ( x i, p i ) называется многоугольником распределения. Кроме того закон распределения СВ может быть задан аналитически в виде функции распределения.
Функцией распределения называется вероятность того, что случайная величина Х примет значение, меньшее произвольно выбранного значения х, то есть X [; x] ;
Для дискретных случайных величин функция распределения F(x) вычисляется по формуле F( x) P( X x i ), где суммирование ведется по тем значеxi x ниям i, для которых x i x, i 1,2,.... Свойства функции распределения приводятся далее (см. функция распределения для непрерывных случайных величин).
Наиболее часто встречающиеся законы распределения 1. Гипергеометрическое распределение P(x k ) Ck Cnk / Cn, где N, M, n – натуральные числа: M N, n N, k 0,1,...,min(n, M).
Пример. Из партии, содержащей М белых и N-M черных, наудачу извлекаются n шаров. Какова вероятность того, что среди выбранных n шаров окажется ровно k белых?
В этом примере СВ, равная числу шаров, имеет гипергеометрическое 2. Распределение СВ, равное числу успехов в n испытаниях, определяется по биноминальному закону распределения:
где n – число испытаний, k – число успехов, р – вероятность успеха в одном испытании, q 1 p - вероятность неудачи.
Формула (1) носит название формулы Бернулли.
3. Для бесконечной последовательности испытаний Бернулли СВ Х, равная числу испытаний до первого успеха включительно, имеет геометрическое распределение где р – вероятность успеха k = 1, 2, ….
4. Если вероятность появления события в последовательности испытаний Бернулли мала, а n велико, то применение формулы Бернулли затрудниk тельно, в этом случае пользуются ее предельным значением Pn (k ) e, где = np. Это формула Пуассона и распределение называется Пуассоновским.
Пример 1. Из партии, содержащей 100 изделий, среди которых 10 дефектных, выбраны случайным образом 5 изделий для проверки их качества.
Построить ряд распределения случайного числа Х дефектных изделий, содержащихся в выборке.
Решение. Случайная величина Х распределена по гипергеометричеC10C 5k скому закону, то есть P( X k ), k – число бракованных изделий, k = 0, 1, 2, 3, 4, 5. Ряд распределения представляется следующей таблицей:
Пример 2. Вероятность того, что некоторая деталь окажется дефектной, равна р. В случае обнаружения дефекта линию останавливают и делают переналадку. Составить ряд распределения для числа Х годных деталей между двумя переналадками.
Решение. Случайная величина Х принимает значения 0, 1, 2, …, k, ….
X = k, когда (k+1)-ая деталь окажется дефектной. Следовательно и ряд распределения представится в виде Плотность распределения. Свойства функции распределения Как уже указывалось, закон распределения для непрерывной СВ задается в виде функции распределения F(x) и плотности распределения f(x)=F(x). График плотности распределения называется кривой распределения. Функция распределения может быть представлена Основные свойства функции распределения F(x):
3. F(x) – неубывающая;
Основные свойства плотности распределения f(x):
Прежде, чем ввести наиболее встречающиеся законы распределения непрерывных СВ, рассмотрим основные числовые характеристики СВ.
Математическое ожидание СВ Х есть число, обозначаемое М(х), а также m x и, и определяемое по формуле где p i P( X x i ), f(x) – плотность распределения.
тивном случае считают, что М(х) не существует. М(х) является характеристикой положения СВ Х.
Дисперсией D(x) СВ Х называют математическое ожидание квадрата отклонения СВ Х от ее математического ожидания Дисперсия является характеристикой рассеяния СВ Х. Кроме нее характеристикой рассеяния является D( x), называемая среднеквадратическим отклонением.
Пример. Производится ряд независимых испытаний, в каждом из которых может появиться некоторое событие А. Вероятность А в каждом опыте равна р. Опыты производятся до первого появления А, после чего они прекращаются. Случайная величина Х – число произвольных опытов. Построить ряд распределений этой случайной величины и найти математическое ожидание и дисперсию.
P(x k ) (1 p) p, q = 1-p, k – число испытаний до первого успеха.
На практике удобней бывает использование формулы D(x) M[x 2 ] M 2 (x), в нашем случае Основные законы распределения непрерывных СВ Среди различных распределений особое место занимает нормальное или гауссовское распределение, которое задается плотностью распределения вида и функцией распределения вида где m x – математическое ожидание, - среднеквадратическое отклонение.
m x и являются параметрами нормального закона распределения, которое обозначается N(mx, ). Для каждого конкретного значения М(х) и имеем свое нормальное распределение.
Кривая нормального распределения (кривая Гаусса) симметрична относительно прямой х = m x и имеет единственный максимум в точке х= m x.
Кривая нормального распределения приведена на рис. 1. Ось абсцисс является асимптотой для этой кривой.
Нормальное распределение с параметрами m x = 0 и = 1 называется стандартным или нормированным и обозначается N(0,1), его плотность распределения определяется формулой Функция распределения стандартного (нормированного) нормального закона распределения имеет вид:
Значения этой функции протабулированы и приводятся в таблицах (см. приложение).
Функцию распределения нормального закона с параметрами m x и можно выразить через N( 0,1) ( x) следующим образом Вероятность попадания случайной величины на отрезок [x 1, x 2 ] определяется в виде:
Функция N( 0,1) ( x) имеет свойство Часто на практике необходимо определить значение xp из уравнения ( x p ) p. Т.е. необходимо определить значение аргумента по заданному значению функции (xp ), которое задается в таблице стандартного нормального распределения (смотри таблицу II приложения). Как видно из таблицы, значения функции (xp ) задаются начиная со значения равного 0.5. В случае, когда необходимо определить x p из уравнения ( x p ) p, при p < 0.5, то можно воспользоваться указанным выше свойством. Значение x p называется квантилью уровня р.
Пример 1. Пусть необходимо определить x p, из условия N( 0,1) (x p ) 0.05.
Решение. По определению функции распределения нужно найти x p из условия P( x x p ) 0.05. Так как значение 0.05 < 0.5, переходим к из таблицы x p 1.64. Квантили нормального закона связаны x p x 1p.
Часто в таблицах приложений приводится не значение функции стандартного нормального закона распределения N(0,1), а интеграл вероятностей Функция распределения нормального стандартного закона распределения связана с функцией Лапласа следующими соотношениями:
Пример 2. Определить вероятность того, что случайная величина Х примет значение в интервале (158, 162), если известно, что она распределена по нормальному закону с параметрами mx 168, 5.92.
лице функции Лапласа ( x) имеем Следовательно P(158 x 162) (1 / 2)[0.6894 0.9090] 0.1106. По таблице 2 приложения функции распределения стандартного нормального закона распределения имеем Вероятность того, что абсолютная величина отклонения СВ от своего математического ожидания меньше любого 0 определяется формулой 1. Производится стрельба по цели, вероятность попадания при каждом выстреле равна 0,6. Найти закон распределения СВ X, равный числу попаданий по цели при двух выстрелах, если число попаданий при втором выстреле не зависит от числа попаданий при первом. Определить математическое ожидание числа попаданий.
2. В денежной лотерее выпущено 100 билетов. Разыгрывается один выигрыш в 10 т.руб., четыре в 5 т.руб., пять в 4 т.руб. и десять в 1 т.руб, Найти закон распределения, математическое ожидание и дисперсию стоимости выигрыша.
3. Случайная величина Х число попаданий мячом в корзину при броске, причем вероятность попадания равна 0,3. Построить ряд распределения, функцию распределения и определить математическое ожидание X.
4. Функция распределения СВ Х имеет вид :
Найти вероятность того, что случайная величина окажется в интервале (3,6). (см. свойства F(x)).
5. Случайная величина Х имеет закон распределения Написать выражение для функции распределения СВ X.
6. Из урны, в которой лежат 2 белых и 8 черных шаров, вынимают 3 шара. Найти распределение вероятностей числа Х вынутых белых шаров.
7. Случайная величина Х распределена по нормальному закону с М(х)=3 и 0.5. Определить вероятность того, что ее значения будут отклоняться от М(х) по абсолютной величине не более, чем на 1.3.
8. На автомате изготовляются заклепки. Диаметр их головок представляет собой случайную величину, распределенную по нормальному закону и имеет М(х) = 2 мм и дисперсию равную 0.01 мм2. Какие размеры диаметра головок заклепки можно гарантировать с вероятностью 0.95.
9. Производится взвешивание некоторого вещества без систематических ошибок. Случайные ошибки взвешивания подчинены нормальному закону со средним квадратическим отклонением = 20 г. Найти вероятность того, что взвешивание будет произведено с ошибкой, не превосходящей по абсолютной величине 10 г.
10. Производятся многократные испытания некоторого элемента на надежность до тех пор, пока элемент не откажет. Найти: математическое ожидание дискретной случайной величины Х - числа опытов, которые надо произвести. Вероятность отказа элемента в каждом опыте равна 0.1.
Для случайной величины Х, распределенной по нормальному закону с заданными m x и определить вероятность попадания в интервал [a,b].
4.3. Контрольные задания по математической статистике 1. Представить исходную выборку в виде статистического ряда и изобразить его графически. Привести график эмпирической функции распределения.
2. Определить моду и медиану.
3. Определить точечные оценки для среднего арифметического, дисперсии, среднеквадратического отклонения.
4. Определить квартили Q1, Q2, Q3.
5. Установить, является ли распределение симметричным, используя коэффициент асимметрии и графический способ Box and Whisker Plot (смотри [8], стр 90 – 91.) 6. Определить интервальные оценки для математического ожидания с уровнями значимости = 0,05 и = 0,01.
Построить интервальный ряд и выполнить пункты задания по математической статистике (см. выше).
№9 9.54 11.46 16.62 12.62 25.75 15.41 14.29 13.13 13.71 10. 5.75 12.46 19.17 13.21 16.00 12.23 14.25 15.37 16.25 19. 4.3.1. Методические указания к выполнению контрольных заданий Основы выборочного метода. Представление результатов наблюдений Математическая статистика (МС) для своих выводов использует наблюдения за случайным явлением с целью получения заключения об источнике наблюдений. При этом выбирается интересующее исследователя свойство (например, производительность труда, здоровье людей и т.д.) и определяются переменные х, у, …, характеризующие это свойство (например, число деталей за смену, показатели сердечно-сосудистой системы и т.д.). Затем случайным образом выбираются объекты из источника наблюдений, на которых измеряются выбранные показатели. Результаты наблюдений обозначаются малыми латинскими буквами x, y, z, … в отличие от переменных, характеризующих свойство, которые обозначаются большими латинскими буквами X, Y, Z, ….
Таким образом, полный набор всех значений N, которое принимает случайная величина Х, называется генеральной совокупностью, где число N может быть конечным и бесконечным. Часть генеральной совокупности из n элементов, отобранных случайным образом, называется выборкой. Число n называется объемом выборки. Различают выборки большого и малого объема. Выборки с n 20 называются малыми, выборки n > 20 называют большими. Это является условным и зависит от решаемой задачи. Выборка называется репрезентативной, если она дает достаточное представление об особенностях генеральной совокупности.
Статистические методы представляют собой методы для получения выводов о генеральной совокупности через выборку.
Методы, касающиеся сбора данных называются описательной статистикой.
Методы, касающиеся заключений о генеральной совокупности называются статистическими выводами.
Поскольку конечная цель статистических исследований - получение заключений о генеральной совокупности по выборке с определенной вероятностью, то методы описательной статистики могут рассматриваться как методы первичной обработки результатов наблюдений и представления их в виде удобном для дальнейшего анализа.
Чтобы правильно обработать исходный ряд наблюдений, необходимо выяснить какого типа количественную случайную переменную предстоит исследовать.
В зависимости от типа множества значений, которые может принимать случайная переменная, выделяют два типа: дискретный и непрерывный.
Случайная переменная дискретного типа может принимать лишь изолированные значения. Случайная переменная непрерывного типа – любое значение из некоторого интервала.
К непрерывным относятся переменные, значения которых получены в результате измерений (иногда они могут быть округлены и представлены в виде целых чисел). Такие переменные как вес, рост, температура, расстояние, время и т.д. являются непрерывными.
Дискретными являются переменные, значения которых определяются в виде некоторых подсчетов.
Первоначально выборки представляют в виде таблицы, состоящей из двух строк, в первой даны номера измерений, во второй – их результаты.
Таблица такого вида называется простым статистическим рядом. Далее этот ряд преобразуют в вариационный ряд, где все наблюдения представляются в порядке возрастания, т.е. в виде:
где x1 x2 … xnmax.
На следующем этапе данный вариационный ряд представляется в виде статистического ряда. Статистический ряд для дискретной переменной это сгруппированный или частотный ряд вида:
Для непрерывных вариационных рядов результаты наблюдений представляются в виде интервального ряда.
Табл. 1 и 2 дают полный вид статистических рядов (они могут представляться и в усеченном виде (в зависимости от решаемой задачи).
Класс границ для интервального ряда можно изобразить на числовой оси.
Из рисунка видно, что граничные точки классов отстоят друг от друга на одну и ту же величину, равную шагу h, который равен h (x max x min ) / k, где k - число классов. Чтобы определить величину этого шага, необходимо установить на какое количество классов k разбивается данный ряд наблюдений.
Это рекомендуется сделать в соответствие со следующими формулами:
k 1 3 322 lg n или k 5 lg n, где n – число наблюдений (объем выборки).
В литературе предлагается также выбирать число классов в зависимости от объема выборки. Для малых выборок k 5 7, для больших k 10 20.
Выбор числа классов является важным моментом. При слишком малом k гистограмма не будет отражать особенностей распределения, при слишком большом k гистограмма будет излишне изрезанной. Значения h и k обычно округляются до ближайшего целого. За начало первого интервала берется точка x min или x min h / 2.
Средняя точка класса определяется в виде x ik x ih h / 2.
Частота m i представляет собой количество наблюдений, соответствующих данному наблюдению для дискретной переменной для сгруппированного ряда или число наблюдений, попавших в данный интервал для интервального ряда. Значение соответствующей частоты, деленной на объем выборки характеризует частость попадания x i в частичные интервалы.
Закон больших чисел в форме Бернулли утверждает, что если эксперимент повторяется n раз при одинаковых условиях, то частость m i / n сходитm ся по вероятности к p i, то есть i p p i. Следовательно, m i / n является приближенными значениями вероятности p i. В отличие от теоретического закона распределения СВ Х, для выборки определяется эмпирический закон распределения.
Сгруппированный и интервальный ряды представляют эмпирическое распределение частот. Для наглядного представления эмпирических распределений сгруппированного ряда строится график, где по оси Х откладываются значения переменной, а по оси У значения частот (частостей). Полученный точки соединяют ломаной линией. Этот график называется полигоном.
Интервальный ряд графически представляется в виде гистограммы.
Гистограмма представляет собой ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы [x i, x i k ], а их высоты равны m i / n или m i, h – длина интервала [x i, x i k ] или шаг. В первом случае площадь гистограммы равна 1, во втором случае -объему выборки n. Результаты в столбцах «накопленные частоты» и «накопленные частости» используются для определения эмпирической функции распределения, с помощью которой также задается частотное распределение.
Эмпирическая функция распределения определяется по значениям накопленных частостей из следующих соотношений:
где суммируются частости тех элементов выборки, для которых выполняется неравенство x i x (х – некоторое значение). Из приведенных формул следует, что На промежутке ( x 1, x n ) Fn ( x) представляет собой неубывающую кусочнопостоянную функцию. Согласно теореме Гливенко эмпирическая функция распределения Fn ( x) является хорошей оценкой генеральной функции распределения F(x) при n.
Пример. Получить статистические ряды для следующих наблюдений и представить графически их частотные распределения.
а) производится наблюдение над величиной урожая пшеницы на 10 опытных участках, результаты представлены в табл. 4.
в) имеем выборку 21 пар обуви 39, 41, 40, 41, 44, 40, 42, 41, 43, 39, 42, 41, 42, 38, 42, 41, 43, 41, 39, 40, 40.
Данные выборки представляют собой непрерывный ряд наблюдений случай а) и дискретный ряд наблюдений – случай в). Поэтому для случая а) нужно построить статистический ряд в виде интервального ряда, в случае в) в виде сгруппированного ряда.
Представляем данный простой статистический ряд в виде вариационного ряда. Имеем:
15.2, 16.4, 17.1, 17.6, 18.2, 18.4, 19.1, 20.4, 20.8, 22.0.
Объем выборки n = 10.
Для представления вариационного ряда в виде интервального ряда необходимо определить ширину интервала h.
Число классов k определяем по формуле В результате округления получаем k = 4.
Интервальный ряд представлен табл. 5.
ся, те значения частот, которые соответствуют соотношению x i x. При заполнении данного столбца на первое место записывается частота, соответствующая первому интервалу. В данном случае это m 1 2. Далее суммируются последовательно частоты первого и второго интервалов и т.д. В результате имеем значение 6, далее 9 и 10.
Столбец “накопленные частости” определяется делением соответствующих накопленных частот на 10, то есть на значение, равное общему объему выборки. Графическое представление полученного интервального ряда (гистограмма) представлена на рис. 2.
Рис. 2. Графическое представление интервального ряда На рис. 3 представлено графическое изображение эмпирической функции распределения (кумулята). При построении кумуляты по оси Х откладываются начальная точка и верхние точки классов, а по оси У значение накопленных частостей. Полученные точки соединяются кривой.
Рис. 3. Графическое представление эмпирической функции распределения Fn ( x) для случайных переменных непрерывного типа Гистограмма и кумулята представляют собой графики эмпирических частотных распределений.
Случай б. Вариационный ряд имеет вид:
38, 39, 39, 39, 40, 40, 40, 40, 40, 41, 41, 41, 41, 41, 41, 42, 42, 42, 42, 43, 43, 44.
Сгруппированный ряд представлен табл. 6.
Для графического изображения частотных распределений необходимо построить полигон и кумуляту.
Для построения полигона по оси Х откладываются возможные значения переменной, по оси У частоты (частости).
В данном случае полигон имеет вид Рис. 4. Графическое представление сгруппированного ряда Эмпирическая функция распределения изображается кумулятой, которая представляет собой неубывающую ступенчатую функцию, скачки которой происходят в точках, соответствующих возможным значениям переменной и равны значению частости в этой точке. По оси Х откладываются значения переменной, по оси У соответствующие накопленные частости.
Рис. 5. Графическое представление эмпирической функции распределения Fn ( x) На практике эмпирическая функция распределения используется, когда при принятии решения необходимо знать текущий итог.
Числовые характеристики выборочных распределений Эмпирические распределения, представляемые для дискретных вариационных рядов в виде полигона и кумуляты, а для непрерывных – в виде гистограммы и кумуляты, позволяют предположить вид генерального распределения.. Кроме этого на практике часто используются числовые характеристики для описания ряда наблюдений. Данные характеристики позволяют проанализировать ряд наблюдений другим способом. Они включают меры расположения, меры рассеивания и меры, характеризующие форму распределения.
Вычисление этих характеристик зависит от того как представлены результаты наблюдений: в виде статистических рядов или в виде простого статистического ряда (исходной выборки). Как было уже сказано, статистический ряд является такой формой представления, когда данные группируются и определяются частоты. В дальнейшем будем называть статистический ряд сгруппированным рядом. Простой статистический ряд не является сгруппированным.
Меры расположения Меры расположения дают информацию о среднем значении, наиболее часто встречающемся значении и о значении, являющимся серединой данных измерений и т.д. Эти меры не дают информации о том, как разбросаны наблюдения относительно среднего числа. К ним относятся мода, медиана, среднее арифметическое, процентили и квартили.
Меры расположения в несгруппированном ряду наблюдений Мода – наиболее часто встречающееся значение в ряду наблюдений.
Для определения моды ряд наблюдений необходимо представить в виде вариационного ряда и определить наиболее часто встречающееся наблюдение.
Ряд наблюдений может иметь два и более таких значений. В первом случае ряд называется бимодальным, во втором - мультимодальным.
Медиана – величина, соответствующая середине в вариационном ряду (то есть число наблюдений меньше медианы равно числу наблюдений больше медианы). Чтобы определить медиану необходимо выполнить следующее:
представить исходный ряд наблюдений в виде вариационного;
если объем выборки число нечетное, то медиана это серединный элемент вариационного ряда, номер которого определяется в виде (n 1) / 2 ;
если объем выборки число четное, то медиана равна среднему значению двух серединных элементов вариационного ряда.
Среднее арифметическое значение, обозначаемое X (вместо Х может быть любая буква латинского алфавита) определяется в виде:
Мода и медиана называются структурными средними, так как они связаны с рядом частот, то есть со структурой распределения. Следует отметить, что на значение среднего арифметического оказывают влияние все значения выборки. Медиана не подвержена такому влиянию.
Пример 1. Для данного вариационного ряда, представляющего собой объем акций 10 наиболее действующих предприятий (в тысячах) определить моду, медиану и среднее арифметическое Мода: наиболее часто встречающееся значение 903 миллиона.
Медиана: так как объем выборки n = 10, то значение является медианой.
Среднее арифметическое:
Процентили являются мерами расположения, которые делят наблюдения на 100 частей. Можно определить 99 процентилей. Р-ый процентиль – это такая величина, что Р % данных являются меньше этой величины и (100-Р) % являются больше.
Процентили широко используются в различного рода отчетах. Для того, чтобы определить Р-ый процентиль необходимо выполнить следующее:
представить результаты наблюдений в виде вариационного ряда;
вычислить номер Р-го процентиля в вариационном ряду где Р – значения процентиля, i – номер процентиля в ряду наблюдений.
определить значение Р-го процентиля:
а) если i – целое, то Р-ый процентиль является средней величиной i – го и (i+1) – го наблюдений в вариационном ряду.
в) если i не является целым числом, то номер Р-го процентиля определяется как целая часть от значения (i+1).
Пример 2. Определить 30-ый процентиль для следующего ряда наблюдений:
Решение. Вариационный ряд:
Так как i не является целым числом, то номер 30-го процентиля в данном вариационном ряду определяется как целая часть от значения 2.4+1=3.4, то есть 3. Следовательно 30-ым процентилем является значение x 3 13.
Квартили это меры расположения, которые делят ряд наблюдений на 4 части. Для этого необходимо 3 квартиля, которые обозначаются Q1, Q2, Q3.
Q1 является 25-ым процентилем, то есть Q1 = Р25.
Q2 является 50-ым процентилем, то есть Q2 = Р50.
Q3 - это 75-ый процентиль, то есть Q3 = Р75.
Пример 3. Определить Q1, Q2, Q3 для следующей выборки:
Решение. Вариационный ряд:
Так как Q1 = Р25, то определяем 25-ый процентиль. Для n = Так как i – целое число, то Р25 определяется как среднее второго и третьего значений в вариационном ряду.
Q1 = 111.5, Q2 = Р50 и является медианой. Так как n – четное, то Меры рассеивания Меры расположения дают информацию об особых точках в ряду наблюдений.
Меры рассеивания характеризуют разброс или дисперсию в выборке.
Меры расположения вместе с мерами рассеивания дают более полное числовое описание наблюдений.
Одними из основных показателей, характеризующих рассеивание в выборке, являются выборочная дисперсия и среднеквадратическое отклонение. Для несгруппированных данных выборочная дисперсия определяется в виде:
где n – объем выборки, X - среднее арифметическое, x i - значение i – го наблюдения.
Среднеквадратическое отклонение Следует отметить, что среднее арифметическое X, дисперсия S 2 и среднее квадратическое отклонение S, определяемые по выборке, являются оценками соответственно для матожидания М(х), дисперсии D(х) и среднеквадратического отклонения, являющихся параметрами генеральной совокупности.
При этом оценки должны удовлетворять определенным свойствам (эффективности, состоятельности и несмещенности см. [1, 2]), поэтому в формуле для выборочной дисперсии (для выполнения условия несмещенности) вводится сомножитель.
Вычислительные формулы В практических задачах кроме представленных выше могут использоваться следующие вычислительные формулы для выборочной дисперсии и стандартного отклонения.
Если среднее арифметическое задано, то Смысл среднеквадратического отклонения (стандартного отклонения) может быть установлен по его применению. Два наиболее используемых способа этого применения: это эмпирическое правило и теорема Чебышева.
Эмпирическое правило справедливо для наблюдений с нормальным законом распределения и утверждает, что 68% данных лежит внутри интервала X 1S.
95% данных лежит внутри интервала X 2S.
99.7% данных лежит внутри интервала X 3S.
Теорема Чебышева применяется для всех распределений. Она утверждает, что внутри k стандартных отклонений от среднего находится (1 1 k 2 ) значений выборки.
Пример. Определить внутри какого интервала лежит по крайней мере 85 % всех величин, если известно X 16.85; S 4.7.
Полученный интервал определяется как X 2.58 4.7, то есть границами являются 4.72 и 28.98.
Формулы для среднего арифметического дисперсии и среднеквадратического отклонения Для сгруппированных данных указанные числовые характеристики определяются в виде:
где xi – средние точки классов; k – число классов.
Вычислительные формулы для сгруппированных данных где n – объем выборки, x i - средние точки в классе.
Структурные средние для сгруппированных данных Для определения моды M 0 и медианы M e рассмотрим фрагмент гистограммы, соответствующий интервалу с наибольшей частотой и двумя соседними интервалами.
Рис. 6. Фрагмент гистограммы для определения моды М где Медиана определяется по формуле где Fl (x) m i выбирается из условия Fl (x) n/2 и Fl 1 (x) n/2, где m l 1 - частота интервала, x l 1 - нижняя граница интервала, для которого выполняется Fl (x) n/2 и Fl 1 (x) n/2 (см. интервальную таблицу).
Пример. Вычислить среднее арифметическое, медиану, моду и среднеквадратическое (стандартное) отклонение для следующего интервального ряда, представленного табл. 7.
Медиана Мода Дисперсия и стандартное отклонение могут быть определены как будет показано далее. Вначале для определения дисперсии используем исходную форk мулу S Определим дисперсию, используя вычислительную формулу. Вычисления представлены в табл. 9.
К мерам формы относятся числовые характеристики, позволяющие сделать вывод о форме частотных распределений выборочных данных.
Рассмотрим числовые характеристики, которые позволяют оценить симметричность распределения. Если относительно наибольшей частоты остальные частоты для соответствующих интервалов приблизительно равны, то такое распределение частот будет изображено гистограммой или полигоном, имеющими симметричную форму (случай а) на рис. 6. Случаи в) и с) приводятся соответственно левосторонняя и правосторонняя эмпирические асимметричные распределения.
распределение частот Коэффициент асимметрии В данном разделе приводится одна из формул для определения коэффициента асимметрии, который используется для определения симметричности распределения.
где Ax – коэффициент асимметрии, S – среднеквадратическое отклонение, X - среднее арифметическое.
Если значение этого коэффициента имеет положительное значение, то распределение имеет правостороннюю (положительную) асимметрию. Если значение Ax отрицательно, то распределение имеет левостороннюю (отрицательную асимметрию. Если Ax 0, то распределение симметрично. Для симметричных распределений выполняется условие: X M 0 M e.
Рассмотрим один из методов статистических выводов, часто используемый на практике, метод оценки параметров генеральной совокупности.
Другие методы статистических выводов такие как методы проверки гипотез и оценки взаимосвязи показателей можно найти в [1,2].
Методы оценки параметров генеральной совокупности делятся на точечные и интервальные.
Точечными оценками параметров генеральной совокупности являются выборочные оценки этих параметров, которые рассматривались нами ранее. Точечные оценки параметров распределения, полученных при выборке, не дают информацию о степени близости их значений теоретическому значению оцениваемого параметра. В этом случае нельзя ответить на вопрос, какую ошибку мы совершаем, принимая вместо теоретического значения параметра его оценку. В связи с этим во многих случаях следует определять не точечную оценку теоретического параметра, а интервальную оценку, которая основана на определении некоторого интервала, внутри которого с определенной вероятностью находится истинное значение параметра. то есть следует определить интервал, который с вероятностью Р охватывает оцениваемое значение параметра.
Одним из наиболее важных для практики генеральных параметров является математическое ожидание или генеральное среднее. Например, управляющий крупной компанией хочет установить, какое количество дней в среднем сотрудники его фирмы пропустили по болезни. Если в фирме тысячи работников, то напрямую получить это число сложно. Используя статистические методы можно определить по выборке среднее арифметическое пропущенных дней и взять эту среднюю арифметическую в качестве оценки генерального среднего и сделать вывод о всей генеральной совокупности по полученному среднему значению. Среднее арифметическое будет являться точечной оценкой генерального среднего, но как точно оценивает оно это генеральное среднее, мы не знаем.
Интервальные оценки дают ответ на этот вопрос.
Если среднее значение, найденное по результатам выборки, является точечной оценкой математического ожидания М(х), то вероятность того, что действительное значение оцениваемой величины М(х) лежит в пределах ( X M(x) X ) определяется в виде:
P 1 - доверительная вероятность, где - уровень значимости, - точность оценки.
Выбор доверительной вероятности определяется конкретными условиями задачи. Обычно используются значения Р = 0.9, 0.95, 0.99.
Для данных значений доверительной вероятности уровень значимости соответственно равен 0.1, 0.05, 0.01. Понимать доверительную вероятность следует следующим образом. Если из генеральной совокупности делать выборки, а по ним определять оценки истинного параметра, то в % случаев эти оценки не будут принадлежать указанному интервалу, который называется доверительным.
На практике важную роль играет длина доверительного интервала.
Следует отметить, что чем меньше длина доверительного интервала, тем точнее оценка. Если длина доверительного интервала велика, то оценка мало пригодна для практики. Длина доверительного интервала связана с объемом выборки и доверительной вероятностью, что видно из формул, приводимых ниже.
Интервальное оценивание математического ожидания случайной величины 1. Исходим из следующих предположений:
генеральная выборка распределена по нормальному закону;
выборка бесповторная;
значение генеральной дисперсии D(х) известно.
В этом случае где X - выборочное среднее, Z / 2 - квантиль нормального распределения или такое значение (см.
таблицу функции распределения Ф(х) стандартизированного нормального распределения N(0,1)) при котором ( Z / 2 ) 1, - средняя квадn ратическая ошибка, Z / 2 - точность оценивания.
Для наиболее употребительных значений доверительной вероятности 1- = 0.9, 0.95, 0.99, 0.9973 квантили стандартизованного нормального распределения Z соответственно равны : Z/2 = 1.64, 1.96, 2.58, 3, 3.37.
2. Исходим из следующих предположений :
генеральная совокупность распределена по нормальному закону;
выборка бесповоротная;
значение D(х) неизвестно, а вместо него используется ее оценка, определяемая по выборке в виде:
В этом случае где t,k - значение квантиля статистики t, распределенной по закону Стьюдента;
k – число степеней свободы или число элементов выборки минус число связей, которые наложены на элементы выборки k = n – 1;
- уровень значимости.
Пример 1. Необходимо установить в течение скольких лет компании данной страны ведут торговлю с Индией. Случайно выбранные 44 фирмы показали, что ведут торговлю в среднем 10.455 лет. Предположим, что известно генеральное среднеквадратическое отклонение и оно равно 7.7 лет.
Построить 90 % доверительный интервал для генерального среднего.
Решение. Имеем n = 44; X 10.55 ; = 7.7. Так как известно генеральное среднеквадратическое отклонение, то доверительный интервал определяется по формуле P 1 0.9; / 2 0.05. По таблице функции распределения стандартизованного нормального распределения определяем Z / 2 1.645. Доверительный интервал вычисляется как Точечная оценка генерального среднего составляет 10.455 лет. Интервальная оценка указывает, что генеральное среднее находится между 8.545 и 12.365.
Точность оценивания 1.91.
Пример 2. На основании обработки данных выборки из 145 значений получено X 31.40 ; S = 3.26. Определить доверительный интервал для генеральной средней с Р = 0.99.
Решение. Доверительный интервал вычисляется по формуле Определяем (см. таблицу в приложении). t 0.01,144 2.58. Границы доверительного интервала Генеральное среднее будет находиться в интервале (30.70, 32.10).
5. УЧЕБНО-МЕТОДИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ДИСЦИПЛИНЫ
1. Колемаев В.А., Калинина В.Н. Теория вероятностей и математическая статистика. – М.: Инфра-М., 1997. – 300 с.2. Вентцель Е.С. Теория вероятностей. – М.: «Высшая школа», 1998. – 575 с.
3. Бекишев Г.А., Митрофанов Е.Н., Семенов А.Т., Соболев В.Ф. Теория вероятностей и математическая статистика. Учебное пособие для студентов заочной формы обучения. – Новосибирск, 1997. – 173 с.
4. Вентцель Е.С., Овчаров Л.А. Теория вероятностей. Сб. задач. – М.:
Высшая школа, 1965. – 363 с.
5. Сборник задач по математике для ВТУЗов. Теория вероятностей и математическая статистика. – М.: Наука, 1990. – 431 с.
6. Константинова Л.И. Теория вероятностей и математическая статистика. Часть I. Рабочая тетрадь. – Томск, 2000. – 48 с.
7. Константинова Л.И. Теория вероятностей и математическая статистика. Часть II. Рабочая тетрадь. – Томск, 2000. – 44 с.
8. Константинова Л.И. Теория вероятностей и математическая статистика. Учебное пособие для студентов ИДО. – Томск, 2005. – 140 с.
ПРИЛОЖЕНИЕ
4.0 0. 4.5 0. 5.0 0. Функция распределения нормированного нормального распределения 0.0 0,50000 50399 50798 51197 51595 51994 52392 52790 0.1 53983 54380 54776 55172 55567 55962 56356 56749 0.2 57926 58317 58706 59095 59483 59871 60257 60642 0.3 61791 62172 62552 62930 63307 63683 64058 64431 0.4 65542 65910 66276 66640 67003 67364 67724 68082 0.5 69146 69497 69847 70194 70540 70884 71226 71566 0.6 72575 72907 73237 73565 73891 74215 74537 74857 0.7 75804 76115 76424 76730 77035 77337 77637 77935 0.8 78814 79103 79389 79673 79955 80234 80511 80785 0.9 81594 81859 82121 82381 82639 82894 83147 83398 1.0 84134 84375 84614 84850 85083 85314 85543 85769 1.1 86433 86650 86864 87076 87286 87493 87698 87900 1.2 88493 88686 88877 89065 89251 89435 89617 89796 1.3 90320 90490 90658 90824 90988 91149 91308 91466 1.4 91924 92073 92220 92364 92507 92647 92786 92922 1.5 93319 93448 93574 93699 93822 93943 94062 94179 1.6 94520 94630 94738 94845 94950 95053 95154 95254 1.7 95543 95637 95728 95818 95907 95994 96080 96164 1.8 96407 96485 96562 96638 96712 96784 96856 96926 1.9 97128 97193 97257 97320 97381 97441 97500 97558 2.0 97725 97778 97831 97882 97932 97982 98030 98077 2.1 98214 98257 98300 98341 98382 98422 98461 98500 2.2 98610 98645 98679 98713 98745 98778 98609 98840 2.3 98928 98956 98983 99010 99036 99061 99066 99111 2.4 99180 99202 99224 99245 99266 99286 99305 99324 2.5 99379 99396 99413 99430 99446 99461 99477 99492 2.6 99534 99547 99560 99573 99585 99598 90609 99621 2.7 99653 99664 99674 99683 99693 99702 99711 99720 2.8 99744 99752 99760 99767 99774 99781 99788 99795 2.9 99813 99819 99825 99831 99836 99841 99846 99851 3.0 99865 99869 99874 99878 99882 99885 99889 99893 3.1 99903 99906 99910 99913 99916 99918 99921 99924 3.2 99931 99934 99936 99938 99940 99942 99944 99946 3.3 99952 99953 99955 99957 99958 99960 99961 99962 3.4 99966 99968 99969 99970 99971 99972 99973 99974 3.5 99977 99978 99978 99979 99980 99981 99981 99982 3.6 99984 99985 99985 99986 99986 99987 99987 99988 3.7 99989 99990 99990 99990 99991 99991 99992 99992 3.8 99993 99993 99993 99994 99994 99994 99994 99995 3.9 99995 99995 99996 99996 99996 99996 99996 99996 4.0 99997 99998 99999 Квантили tp(n) порядка р распределения Стьюдента Плотность стандартного нормального распределения ( x) e 0.0 0.3989 0.3989 0.3989 0.3988 0.3986 0.3984 0.3982 0.3980 0.3977 0. 1.0 0.2420 0.2396 0.2371 0.2347 0.2323 0.2299 0.2275 0.2251 0.2227 0. 2.0 0.0540 0.0529 0.0519 0.0508 0.0498 0.0488 0.0478 0.0468 0.0469 0. 3.0 0.0044 0.0043 0.0042 0.0040 0.0039 0.0038 0.0037 0.0036 0.0035 0. Уровни значимости дли одностороннего критерия (Q) Уровни значимости для одностороннего критерия (2Q)ТЕОРИЯ ВЕРОЯТНОСТЕЙ И
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Рабочая программа, методические указания и контрольные задания Составитель: Людмила Ивановна Константинова Рецензент: Г.Е. Шевелев, к. ф.-м. н., доцент кафедры ПМ АВТФ Формат 60х84/16. Бумага офсетная.Плоская печать. Усл. печ. л. 3,02. Уч. -изд. л. 2,74.
Издательство ТПУ. 634050, Томск, пр. Ленина, 30.