Автономное учреждение среднего профессионального образования
Ханты-Мансийского автономного округа-Югры
Сургутский профессиональный колледж
Выполнение расчетных работ
по статистике
Учебное пособие
Сургут, 2012
1
Выполнение расчетных работ по статистике. Учебное пособие.
- Сургутский профессиональный колледж. - 2012.
Составитель:
Т.Н. Масанина, преподаватель математики Учебное пособие предназначено для студентов, обучающихся по специальности 230115 «Программирование в компьютерных системах».
В пособии приводятся алгоритм построения вариационных рядов и примеры первичной обработки статистических данных.
Рассмотрено на заседании методического объединения «Математика, информатика и физика».
Протокол № 4 от 02.02. 2012 года.
Рекомендовано к печати Методическим советом Сургутского профессионального колледжа.
Протокол № 4 от 17.02. 2012 года.
Оглавление Введение
Интервальный вариационный ряд
1.
Практическая работа №1. Построение интервального вариативного ряда
2.
Статистические оценки параметров распределения
3.
4. Практическая работа №2. Нахождение статистических оценок параметров распределения
Варианты заданий
5.
Литература
Введение Учебное пособие "Выполнение расчетных работ по статистике" по дисциплине теория вероятностей и математическая статистика предназначено для студентов, обучающихся по специальности 230115 «Программирование в компьютерных системах».
Предложенный материал окажет помощь в выполнении практических работ по темам:
«Построение интервального вариационного ряда» и «Нахождение статистических оценок параметров распределения».
Пособие содержит краткое изложение теории основных понятий интервальных вариационных рядов, статистических оценок параметров распределения и подробный разбор примеров.
Данное учебное пособие могут использовать в своей работе преподаватели с целью организации закрепления полученных теоретических знаний, умений студентами по темам: «Построение интервального вариационного ряда» и «Нахождение статистических оценок параметров распределения».
1. Интервальный вариационный ряд Если изучаемая случайная величина является непрерывной, то ранжирование и группировка наблюдаемых значений зачастую не позволяют выделить характерные черты варьирования ее значений. Это объясняется тем, что отдельные значения случайной величины могут как угодно мало отличаться друг от друга и поэтому в совокупности наблюдаемых данных одинаковые значения величины могут встречаться редко, а частоты вариантов мало отличаться друг от друга.
Нецелесообразно также построение дискретного ряда для дискретной случайной величины, число возможных значений которой велико.
В подобных случаях следует строить интервальный (вариационный) ряд распределения.
Интервальным вариационным рядом (интервальным рядом распределения) называется упорядоченная совокупность интервалов варьирования (изменения) значений случайной величины с соответствующими частотами или частностями попаданий в каждый из них значений случайной величины.
Вариационный ряд распределения- это ряд, построенный по количественному признаку. Вариантами называются наблюдаемые значения признака.
Частота- это численность отдельных вариант или каждой группы вариационного ряда. Частоты, выраженные в долях единиц или в процентах к итогу, называются частностями. Относительные частоты или частности обозначают :.
Фактически, при построении интервального вариационного ряда, мы стремимся привести его к виду дискретного вариационного ряда. Единственное существенное отличие – наличие интервалов варьирования.
Алгоритм построения интервального вариационного ряда 1. Записать ранжированный вариационный ряд, располагая значения случайной величины в порядке возрастания.
2. Найти размах варьирования.
Размах вариации представляет собой разность между максимальным и минимальным 3. Определить число интервалов.
Число интервалов вариационного ряда определяется по формуле Стерджеса:
4. Найти длину частичного интервала:. Полученное число можно округлить для удобства вычислений, но только в сторону увеличения. Длину частичного интервала следует выбрать так, чтобы получившийся ряд не был громоздким и в тоже время позволял выявить характерные черты изменений случайной величины, т.е.
характерные черты изучаемого явления.
5. Взять за начало первого интервала минимальное значение случайной величины или для удобства вычислений округлить его, но только в сторону уменьшения для удобства вычислений. Например, 5,01 округляют до 5,0 и обозначают начало первого интервала 6. Построить последовательность частичных интервалов (длины интервалов одинаковые).
пока не получится последний интервал, в который обязательно должно входить.
чтобы варианты попали в тот или иной интервал и не учитывались дважды. Последний 7. Определить среди значений выборки, сколько вариант входит в каждый из интервалов. Для этого ранжированный вариационный ряд следует разбить на интервалы. Таким образом, будут найдены частоты (интервальные частоты).
8. Записать частоты и относительные частоты в таблицу.
Обычно эта часть работы требует особого внимания. Одним из критериев правильности служит сумма частот, которая должна равняться объему выборки и сумма относительных частот должна равняться 1.
9. Определить середины интервалов и записать их в таблицу.
Середины интервалов определяются как полусумма концов промежутка. Например для первого интервала:
10. Определить кумулятивные частоты вариант.
Для первого интервала Для второго интервала кумулятивные (накопленные) частоты записать в таблицу.
11. Построить полигон, гистограмма, кумуляту.
Для наглядного представления результатов выборки используют полигон частот- это кусочно-линейный график, на котором по оси абсцисс откладываются точки, соответствующие серединам данных интервалов, а по оси ординат – их относительные частоты. После этого полученные точки соединяются ломанной линией.
Гистограмма распределения строится аналогично полигону в прямоугольной системе координат. В отличие от полигона при построении гистограммы на оси абсцисс выбирают не точки, а отрезки, изображающие интервал, а вместо ординат, соответствующих частотам или относительным частотам отдельных вариант, строят прямоугольники с высотой, которая вычисляется по формуле:.
Кумулятивная кривая (кривая сумм — кумулята) получается при изображении вариационного ряда с накопленными частотами или относительными частотами в прямоугольной системе координат. При построении кумуляты интервального вариационного ряда нижней границе первого интервала соответствует частота, равная нулю, а верхней — вся частота интервала. Верхней границе второго интервала соответствует накопленная частота первых двух интервалов (т. е. сумма частот этих интервалов) и т. д. Верхней границе последнего (максимального) интервала соответствует накопленная частота, равная сумме всех частот.
2. Практическая работа №1. Построение интервального вариативного ряда Пусть имеется совокупность значений случайной величины.
244, 369, 451, 302, 414, 545, 801, 597, 972, 233, 359, 436, 680, 517, 411, 300, 144, 142, 275, 593, 961, 845, 580, 428, 320, 217, 352, 513, 661, 649, 497, 372, 273, 139, 107. 271, 370, 496, 615, 207, 312, 426, 571, 825, 816, 558, 416, 305, 207, 150.
Задание:
Построить интервальный вариационный ряд.
По данным интервального вариационного ряда построить полигон, гистограмму, кумуляту.
Решение:
1. Построим ранжированный ряд, расположив наблюдаемые значения в порядке возрастания и для удобства, занесем их в таблицу 1.
2. Найдем размах варьирования:
3. Определим число интервалов:
4. Найдем длину частичного интервала:
5. Найдем начало первого частичного интервала:
6. Построим последовательность частичных интервалов:
Запишем полученную последовательность интервалов: [107;231), [231;355), [355;479), [479;603) [603; 727), [727;851), [851;975].
7. Определим количество вариант, входящих в каждый интервал:
[231;355):
[355;479):
[479;603):
[603; 727):
[727;851):
[851;975]:
Таким образом, получили частоты (интервальные частоты). Критерием правильности определения частот служит сумма частот, которая равняется объему выборки:
8. Запишем найденные данные в таблицу 2.
9. Определим середины интервалов и запишем их в таблицу 2 в столбец.
Середины интервалов найдем как полусумму концов промежутков.
Данные внесем в таблицу 2.
10. Определим кумулятивные частоты вариант.
Для первого интервала для второго интервала для третьего интервала для четвертого интервала для пятого интервала для шестого интервала для седьмого интервала:
Найденные значения кумулятивных (накопленных) частот запишем в таблицу 2 в столбец.
Таким образом, мы закончили построение вариационного интервального ряда. При этом в таблице 2 содержатся все необходимые данные для построения геометрической интерпретации данного ряда.
11. Строим полигон, гистограмму, кумуляту.
полигон относительных частот 0, 0, 0, гистограмма относительных частот 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 3. Статистические оценки параметров распределения Как уже отмечалось, о свойствах генеральной совокупности (случайной величины x) можно судить по данным над отобранными объектами, т.е. по выборке.
Поэтому для дальнейшего изучения изменения значений случайной величины используют числовые характеристики вариационных рядов.
Поскольку эти характеристики вычисляются по статистическим даным, их обычно называют статистическими характеристиками или статистическими оценками.
Числовые характеристики, найденные по выборочной совокупности, считают статистическими оценками теоретических числовых характеристик случайной величины (параметров теоретического распределения).
1. Выборочное среднее.
Простейшей статистической оценкой является выборочное среднее. Выборочное среднееэто среднее значение вариант, обозначается.
Выборочное среднее является статистической оценкой математического ожидания.
2. Выборочная дисперсия.
Выборочная дисперсия есть статистическая оценка теоретической дисперсии характеризующая разброс и рассеяние вариант и есть среднее арифметическое квадратов отклонений наблюдаемых значений случайной величины от их среднего значения:
3. Выборочное среднее квадратическое (квадратичное) отклонение Выборочное среднее квадратическое (квадратичное) отклонение - есть квадратный корень из выборочной дисперсии.
4. Исправленная дисперсия.
Исправленная дисперсия считается более точной оценкой теоретической дисперсии (дисперсии генеральной совокупности) и зависит от объема выборки.
Исправленная дисперсия находится по формуле:
5. Стандартное отклонение.
Стандартное отклонение определяется как квадратный корень из дисперсии.
6. Мода.
Если вариационный ряд составлен по значениям генеральной совокупности, то модой является значение, имеющее максимальную частоту.
Если вариационный ряд составлен по интервалам значений генеральной совокупности (интервальный ряд), то мода вычисляется по следующей приближенной формуле:
где - обозначение моды;
- начало модального интервала, т.е. интервала, имеющего максимальную частоту;
- длина модального интервала;
- частота модального интервала;
- частоты соответственно предшествующего и последующего за модальным интервалом.
7. Медиана.
Медианой выборки является значение серединного элемента вариационного ряда.
Если вариационный ряд составлен по интервалам значений (интервальный вариационный ряд), то медиана вычисляется по приближенной формуле:
где - обозначение медианы;
- начало модального интервала, т.е. интервала, в котором содержится серединный элемент;
- длина медианного интервала;
- объем выборки;
- частота медианного интервала;
- сумма частот интервалов, предшествующих медианному.
4. Практическая работа №2. Нахождение статистических оценок параметров распределения Задание: Вычислить основные числовые характеристики: выборочное среднее, выборочную дисперсию, выборочное среднее квадратическое отклонение, исправленную дисперсию, стандарт, моду и медиану.
1. Определим выборочное среднее для нашего примера:
2. Найдем выборочную дисперсию.
3. Вычислим выборочное среднее квадратическое (квадратичное) отклонение.
4. Вычислим исправленную дисперсию.
5. Находим стандарт отклонения:
6. Найдем моду для нашего примера.
Используем формулу:
7. Вычислим медиану для нашего примера.
Используем формулу:
5. Варианты заданий Вариант Вариант Вариант Вариант Вариант Вариант Вариант Вариант Вариант Вариант Литература 1. Бычков А.Г. Сборник задач по теории вероятностей, математической статистике:
учебник для СПО. – М.: ФОРУМ: ИНФРА-М., 2008. -240 с.:ил.
2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. Учеб.пособие для вузов. Изд. 5-е, стер. – М.: Высш.
шк., 1999.-400 с.: ил.
3. Горелова Г.В. Теория вероятностей и математическая статистика в примерах и задачах с применением Ехсеl / Г.В. Горелов, И.А. Кацко.- 4-е изд. – Ростов н/Д :
Феникс. 2006. -475с.
4. Колде Я.К. Практикум по теории вероятностей и математической статистике: Учеб.
пособие для техникумов. – М.: Высш.шк., 1991. – 157 с.: ил.
5. Кочетков Е.С. Теория вероятностей и математическая статистика : учеб./ Е.С.
Кочетков, С.О. Смерчинская, В.В. Соколов.-2-е изд. – М.: ФОРУМ, 2008-240с.
6. Максимов О.В. Теория вероятностей и математическая статистика: учебник для СПО. – М.: Дашков и К, 2006. – 320с.