WWW.DISS.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
(Авторефераты, диссертации, методички, учебные программы, монографии)

 

2

1. Информация из ФГОС, относящаяся к дисциплине

1.1. Вид деятельности выпускника

Дисциплина охватывает круг вопросов относящихся к виду деятельности выпускника:

научно-исследовательской

1.2. Задачи профессиональной деятельности выпускника

В дисциплине рассматриваются указанные в ФГОС задачи

профессиональной деятельности выпускника:

- участие в составе коллектива исполнителей в выполнении теоретических и экспериментальных научных исследований по поиску проверке новых идей совершенствования наземных транспортно-технологических машин, их технологического оборудования и создания комплексов на их базе;

- участие в составе коллектива исполнителей в техническом обеспечении исследований и реализации их результатов.

Перечень компетенций, установленных ФГОС 1.3.

Освоение программы настоящей дисциплины позволит сформировать у обучающегося следующие компетенции:

- способен в составе коллектива исполнителей участвовать в техническом обеспечении исследований и реализации их результатов (ПК-7).

Перечень умений и знаний, установленных ФГОС 1.4.

Студент после освоения программы настоящей дисциплины должен:

знать:

основные положения теории вероятностей и математической статистики;

возможности и ограничения конкретных статистических методов, уметь подобрать адекватный метод анализа в соответствии с целью исследования и характером статистических данных;

четкое представление о существующих подходах к статистическому анализу экспериментальных данных;

представление о возможностях статистической обработки данных с использованием электронных таблиц (Excel), математических пакетов общего назначения (MathCAD) и специализированных программ статистического анализа (Statistica, SPSS и др.).

уметь:

обрабатывать экспериментальные данные, как выборочные измерения;

статистическая оценка экспериментальных данных, проверка гипотез (дескриптивная статистика);

кластерный, факторный и регрессионный анализ (линейные и нелинейные регрессионные модели);

практические навыки статистической обработки данных, в том числе с использованием вычислительной техники;

представить содержательную интерпретацию результатов статистической обработки экспериментальных данных.

владеть:

методами математической обработки данных эксперимента при помощи программы Statistica;

методами статистической обработки одномерных и многомерных выборок;

кластерным, факторным и регрессионным анализом.

2. Цели и задачи освоения программы дисциплины Цели:

обучение студентов применению методов математической статистики для обработки и анализа экспериментальных данных.

Задачи:

изучение основных положений теории вероятностей и математической статистики;

изучение современных методов статистического анализа экспериментальных данных;

практическое освоение методов статистической обработки одномерных и многомерных выборок;

знакомство с возможностями компьютерных пакетов статистического анализа.

3. Место дисциплины в структуре ООП Для изучения дисциплины, необходимо освоение содержания дисциплин:

математики (ОК-10, ПК-1), информатики (ОК-11, ОК-12, ОК-13, ПК-4), физики (ОК-6, ПК-1).

Знания и умения, приобретаемые студентами после освоения содержания дисциплины, будут использоваться в: экономике предприятия (ОК-9, ОК-12, ПК-15), планировании экспериментальных исследований (ОК-10, ПК-5, ПК-6), курсовом (ПК-9, ПК-10) и дипломном проектировании (ОК-12, ОК-15, ПК-6, ПК-8).

4. Основная структура дисциплины Таблица 1 – Структура дисциплины Вид учебной работы Трудоемкость в часах Всего Семестр № Общая трудоемкость дисциплины 180 (5 ЗЕТ) 180 (5 ЗЕТ) Аудиторные занятия, в том числе: 68 лекции 34 лабораторные работы 34 практические/семинарские заня- - тия Самостоятельная работа (в том числе 76 курсовое проектирование) Вид промежуточной аттестации (ито- Экзамен-36 Экзамен- гового контроля по дисциплине), в том числе курсовое проектирование 5. Содержание дисциплины 5.1 Перечень основных разделов и тем дисциплины Тема 1. ЭЛЕМЕНТАРНЫЕ ПОНЯТИЯ СТАТИСТИКИ Тема 2. ОСНОВНЫЕ СТАТИСТИКИ И ТАБЛИЦЫ Тема 3. ТИПИЧНЫЕ МЕТОДЫ ВИЗУАЛИЗАЦИИ Тема 4. СЛОЖНЫЕ ПЛАНЫ Тема 5. КОВАРИАЦИОННЫЙ АНАЛИЗ (ANCOVA)

Тема 6. МНОГОМЕРНЫЕ ПЛАНЫ: МНОГОМЕРНЫЙ ДИСПЕРСИОННЫЙ И

КОВАРИАЦИОННЫЙ АНАЛИЗ

Тема 7. ДИСПЕРСИОННЫЙ АНАЛИЗ Тема 8. МНОЖЕСТВЕННАЯ РЕГРЕССИЯ

Тема 9. НЕПАРАМЕТРИЧЕСКАЯ СТАТИСТИКА И ПОДГОНКА РАСПРЕДЕЛЕНИЯ

Тема 10. ОБЩИЕ ЛИНЕЙНЫЕ МОДЕЛИ Тема 11. МЕЖГРУППОВЫЕ ПЛАНЫ Тема 12. ГЛАВНЫЕ КОМПОНЕНТЫ И ФАКТОРНЫЙ АНАЛИЗ Тема 13. КЛАСТЕРНЫЙ АНАЛИЗ 5.2 Краткое описание содержания теоретической части разделов и тем дисциплины Тема 1. Элементарные понятия статистики Обзор элементарных понятий статистики. Это введение представляет собой краткое обсуждение элементарных понятий, лежащих в основе любой процедуры статистического анализа данных. Мы выбрали темы, которые иллюстрируют основные предположения большинства статистических методов, предназначенных для понимания "численной природы" действительности (Nisbett, et al., 1987). Мы сосредотачиваем основное внимание на "функциональных" аспектах обсуждаемых понятий, прекрасно понимая, что предлагаемое описание является кратким и не может исчерпать всего предмета обсуждения. Более подробную информацию можно найти во вводных разделах и разделах примеров руководства пользователя системы STATISTICA, а также в учебниках по статистике. Мы рекомендуем следующие учебники: Kachigan (1986) и Runyon and Haber (1976); для углубленного обсуждения элементарной теории и основных понятий статистики см. классическую книгу Kendall and Stuart (1979) (перевод: М.Кендалл и А.Стьюарт "Теория распределений" (том 1), "Статистические выводы и связи" (том 2), "Многомерный статистический анализ" (том 3)). На русском языке см., например, книгу: Боровиков В.П. "Популярное введение в программу STATISTICA", Компьютер Пресс 1998, в которой дается популярное описание основных статистических понятий.



Переменные - это то, что можно измерять, контролировать или что можно изменять в исследованиях. Переменные отличаются многими аспектами, особенно той ролью, которую они играют в исследованиях, шкалой измерения и т.д.

Исследование зависимостей в сравнении с экспериментальными исследованиями. Большинство эмпирических исследований данных можно отнести к одному из названных типов. В исследовании корреляций (зависимостей, связей...) вы не влияете (или, по крайней мере, пытаетесь не влиять) на переменные, а только измеряете их и хотите найти зависимости (корреляции) между некоторыми измеренными переменными, например, между кровяным давлением и уровнем холестерина. В экспериментальных исследованиях, напротив, вы варьируете некоторые переменные и измеряете воздействия этих изменений на другие переменные. Например, исследователь может искусственно увеличивать кровяное давление, а затем на определенных уровнях давления измерить уровень холестерина. Анализ данных в экспериментальном исследовании также приходит к вычислению "корреляций" (зависимостей) между переменными, а именно, между переменными, на которые воздействуют, и переменными, на которые влияет это воздействие. Тем не менее, экспериментальные данные потенциально снабжают нас более качественной информацией. Только экспериментально можно убедительно доказать причинную связь между переменными.

Например, если обнаружено, что всякий раз, когда изменяется переменная A, изменяется и переменная B, то можно сделать вывод - "переменная A оказывает влияние на переменную B", т.е. между переменными А и В имеется причинная зависимость. Результаты корреляционного исследования могут быть проинтерпретированы в каузальных (причинных) терминах на основе некоторой теории, но сами по себе не могут отчетливо доказать причинность.

Зависимые и независимые переменные. Независимыми переменными называются переменные, которые варьируются исследователем, тогда как зависимые переменные - это переменные, которые измеряются или регистрируются.

Может показаться, что проведение этого различия создает путаницу в терминологии, поскольку как говорят некоторые студенты "все переменные зависят от чего-нибудь". Тем не менее, однажды отчетливо проведя это различие, вы поймете его необходимость. Термины зависимая и независимая переменная применяются в основном в экспериментальном исследовании, где экспериментатор манипулирует некоторыми переменными, и в этом смысле они "независимы" от реакций, свойств, намерений и т.д. присущих объектам исследования. Некоторые другие переменные, как предполагается, должны "зависеть" от действий экспериментатора или от экспериментальных условий. Иными словами, зависимость проявляется в ответной реакции исследуемого объекта на посланное на него воздействие. Отчасти в противоречии с данным разграничением понятий находится использование их в исследованиях, где вы не варьируете независимые переменные, а только приписываете объекты к "экспериментальным группам", основываясь на некоторых их априорных свойствах. Например, если в эксперименте мужчины сравниваются с женщинами относительно числа лейкоцитов (WCC), содержащихся в крови, то Пол можно назвать независимой переменной, а WCC зависимой переменной.

Шкалы измерений. Переменные различаются также тем "насколько хорошо" они могут быть измерены или, другими словами, как много измеряемой информации обеспечивает шкала их измерений. Очевидно, в каждом измерении присутствует некоторая ошибка, определяющая границы "количества информации", которое можно получить в данном измерении. Другим фактором, определяющим количество информации, содержащейся в переменной, является тип шкалы, в которой проведено измерение. Различают следующие типы шкал:(a) номинальная, (b) порядковая (ординальная), (c) интервальная (d) относительная (шкала отношения). Соответственно, имеем четыре типа переменных: (a) номинальная, (b) порядковая (ординальная), (c) интервальная и (d) относительная.

Номинальные переменные используются только для качественной классификации. Это означает, что данные переменные могут быть измерены только в терминах принадлежности к некоторым, существенно различным классам; при этом вы не сможете определить количество или упорядочить эти классы. Например, вы сможете сказать, что 2 индивидуума различимы в терминах переменной А (например, индивидуумы принадлежат к разным национальностям). Типичные примеры номинальных переменных - пол, национальность, цвет, город и т.д. Часто номинальные переменные называют категориальными.

Порядковые переменные позволяют ранжировать (упорядочить) объекты, указав какие из них в большей или меньшей степени обладают качеством, выраженным данной переменной. Однако они не позволяют сказать "на сколько больше" или "на сколько меньше". Порядковые переменные иногда также называют ординальными. Типичный пример порядковой переменной социоэкономический статус семьи. Мы понимаем, что верхний средний уровень выше среднего уровня, однако сказать, что разница между ними равна, скажем, 18% мы не сможем. Само расположение шкал в следующем порядке:

номинальная, порядковая, интервальная является хорошим примером порядковой шкалы.

Интервальные переменные позволяют не только упорядочивать объекты измерения, но и численно выразить и сравнить различия между ними.

Например, температура, измеренная в градусах Фаренгейта или Цельсия, образует интервальную шкалу. Вы можете не только сказать, что температура градусов выше, чем температура 30 градусов, но и что увеличение температуры с 20 до 40 градусов вдвое больше увеличения температуры от 30 до 40 градусов.

Относительные переменные очень похожи на интервальные переd.

менные. В дополнение ко всем свойствам переменных, измеренных в интервальной шкале, их характерной чертой является наличие определенной точки абсолютного нуля, таким образом, для этих переменных являются обоснованными предложения типа: x в два раза больше, чем y. Типичными примерами шкал отношений являются измерения времени или пространства. Например, температура по Кельвину образует шкалу отношения, и вы можете не только утверждать, что температура 200 градусов выше, чем 100 градусов, но и что она вдвое выше. Интервальные шкалы (например, шкала Цельсия) не обладают данным свойством шкалы отношения. Заметим, что в большинстве статистических процедур не делается различия между свойствами интервальных шкал и шкал отношения.

Тема 2. Основные статистики и таблицы "Истинное" среднее и доверительный интервал. Вероятно, большинство из вас использовало такую важную описательную статистику, как среднее. Среднее - очень информативная мера "центрального положения" наблюдаемой переменной, особенно если сообщается ее доверительный интервал. Исследователю нужны такие статистики, которые позволяют сделать вывод относительно популяции в целом. Одной из таких статистик является среднее. Доверительный интервал для среднего представляет интервал значений вокруг оценки, где с данным уровнем доверия (см. Элементарные понятия статистики), находится "истинное" (неизвестное) среднее популяции. Например, если среднее выборки равно 23, а нижняя и верхняя границы доверительного интервала с уровнем p=.95 равны 19 и 27 соответственно, то можно заключить, что с вероятностью 95% интервал с границами 19 и 27 накрывает среднее популяции. Если вы установите больший уровень доверия, то интервал станет шире, поэтому возрастает вероятность, с которой он "накрывает" неизвестное среднее популяции, и наоборот. Хорошо известно, например, что чем "неопределенней" прогноз погоды (т.е. шире доверительный интервал), тем вероятнее он будет верным. Заметим, что ширина доверительного интервала зависит от объема или размера выборки, а также от разброса (изменчивости) данных. Увеличение размера выборки делает оценку среднего более надежной.

выборки, скажем, до 100 или более, качество оценки улучшается и без предположения нормальности выборки.

Форма распределения; нормальность. Важным способом "описания" переменной является форма ее распределения, которая показывает, с какой частотой значения переменной попадают в определенные интервалы. Эти интервалы, называемые интервалами группировки, выбираются исследователем. Обычно исследователя интересует, насколько точно распределение можно аппроксимировать нормальным (см. ниже картинку с примером такого распределения) (см.

также Элементарные понятия статистики). Простые описательные статистики дают об этом некоторую информацию. Например, если асимметрия(показывающая отклонение распределения от симметричного) существенно отличается от 0, то распределение несимметрично, в то время как нормальное распределение абсолютно симметрично. Итак, у симметричного распределения асимметрия равна 0. Асимметрия распределения с длинным правым хвостом положительна. Если распределение имеет длинный левый хвост, то его асимметрия отрицательна. Далее, если эксцесс (показывающий "остроту пика" распределения) существенно отличен от 0, то распределение имеет или более закругленный пик, чем нормальное, или, напротив, имеет более острый пик (возможно, имеется несколько пиков). Обычно, если эксцесс положителен, то пик заострен, если отрицательный, то пик закруглен. Эксцесс нормального распределения равен 0.

Более точную информацию о форме распределения можно получить с помощью критериев нормальности (например, критерия Колмогорова-Смирнова или W критерия Шапиро-Уилка). Однако ни один из этих критериев не может заменить визуальную проверку с помощью гистограммы (графика, показывающего частоту попаданий значений переменной в отдельные интервалы).

Гистограмма позволяет "на глаз" оценить нормальность эмпирического распределения. На гистограмму также накладыва-ется кривая нормального распределения. Гистограмма позволяет качественно оценить различные характеристики распределения. Например, на ней можно увидеть, что распределение бимодально (имеет 2 пика). Это может быть вызвано, например, тем, что выборка неоднородна, возможно, извлечена из двух разных популяций, каждая из которых более или менее нормальна. В таких ситуациях, чтобы понять природу наблюдаемых переменных, можно попытаться найти качественный способ разделения выборки на две части.

Корреляции Определение корреляции. Корреляция представляет собой меру зависимости переменных. Наиболее известна корреляция Пирсона. При вычислении корреляции Пирсона предполагается, что переменные измерены, как минимум, в интервальной шкале. Некоторые другие коэффициенты корреляции могут быть вычислены для менее информативных шкал. Коэффициенты корреляции изменяются в пределах от -1.00 до +1.00. Обратите внимание на крайние значения коэффициента корреляции. Значение -1.00 означает, что переменные имеют строгую отрицательную корреляцию. Значение +1.00 означает, что переменные имеют строгуюположительную корреляцию. Отметим, что значение 0. предполагает, что две рассматриваемые переменные измерены, по крайней мере, в интервальной шкале (см. Элементарные понятия статистики). Она определяет степень, с которой значения двух переменных "пропорциональны" друг другу. Важно, что значение коэффициента корреляции не зависит от масштаба измерения. Например, корреляция между ростом и весом будет одной и той же, независимо от того, проводились измерения в дюймах и фунтах или сантимерах и килограммах. Пропорциональность озна зависимость "можно представить" прямой линией (с положительным или отрицательным углом наклона).

Проведенная прямая называется прямой регрессии или прямой, построенной методом наименьших квадратов. Последний термин связан с тем, что сумма квадратов расстояний (вычисленных по оси Y) от наблюдаемых точек до прямой является минимальной.

Заметим, что использование квадратов расстояний приводит к тому, что оценки параметров прямой сильно реагируют на выбросы.

Как интерпретировать значения корреляций. Коэффициент корреляции Пирсона (r) представляет собой меру линейной зависимости двух переменных.

Если возвести его в квадрат, то полученное значение коэффициента детерминации r2) представляет долю вариации, общую для двух переменных (иными словами, "степень" зависимости или связанности двух переменных). Чтобы оценить зависимость между переменными, нужно знать как "величину" корреляции, так и ее значимость.

Значимость корреляций. Уровень значимости, вычисленный для каждой корреляции, представляет собой главный источник информации о надежности корреляции. Как объяснялось выше (см. Элементарные понятия статистики), значимость определенного коэффициента корреляции зависит от объема выборок. Критерий значимости основывается на предположении, что распределение остатков (т.е. отклонений наблюдений от регрессионной прямой) для зависимой переменной y является нормальным (с постоянной дисперсией для всех значений независимой переменной x). Исследования методом Монте-Карло показали, что нарушение этих условий не является абсолютно критичным, если размеры выборки не слишком малы, а отклонения от нормальности не очень большие. Тем не менее, имеется несколько серьезных опасностей, о которых следует знать, для этого см. следующие разделы.

Выбросы. По определению, выбросы являются нетипичными, резко выделяющимися наблюдениями. Так как при построении прямой регрессии используется сумма квадратов расстояний наблюдаемых точек до прямой, то выбросы могут существенно повлиять на наклон прямой и, следовательно, на значение коэффициента корреляции. Поэтому единичный выброс (значение которого корреляции). Это показано в следующем примере, где мы назвали исключенные точки "выбросами"; хотя, возможно, они являются не выбросами, а экстремальными значениями.

Обычно считается, что выбросы представляют собой случайную ошибку, которую следует контролировать. К сожалению, не существует общепринятого метода автоматического удаления выбросов (тем не только искусственно увеличить значение коэффициента корреляции, но также реально уменьшить существующую корреляцию.

Тема 3. Типичные методы визуализации Категоризованные графики Одним из наиболее мощных аналитических методов исследования является разделение ("разбиение") данных на группы для сравнения структуры получившихся подмножеств. Эти методы широко применяются как в разведочном анализе данных, так и при проверке гипотез и известны под разными названиями (классификация, группировка, категоризация, разбиение, расслоение и пр.).

Например, взаимосвязь между возрастом и риском инфаркта может отличаться для мужчин и женщин (для мужчин эта зависимость сильнее). Или например, зависимость между приемом лекарств и снижением уровня холестерина может наблюдаться только для женщин с пониженным давлением и в возрасте 30- лет. Производительность или гистограммы мощности могут различаться для временных промежутков, когда управление осуществляется разными операторами. Разным экспериментальным группам также могут соответствовать разные наклоны линий регрессии.

Для количественного описания различий между группами наблюдений разработаны многочисленные вычислительные методы, основанные на группировке данных (например, дисперсионный анализ). Однако графические средства (такие как рассматриваемые в этом разделе категоризованные графики) дают особые преимущества и позволяют выявить закономерности, которые трудно поддаются количественному описанию и которые весьма сложно обнаружить с помощью вычислительных процедур (например, сложные взаимосвязи, исключения или аномалии). В этих случаях графические методы предоставляют уникальные возможности многомерного аналитического исследования или "добычи" данных.

Что такое категоризованные графики Термин "категоризованные графики" впервые был использован в программе STATISTICA компании StatSoft каждой выбранной категории (подмножества) наблюдений, например, опрашиваемых из Нью-Йорка, Чикаго или Далласа. Эти "входящие" графики располагаются последовательно в одном графическом окне, позволяя сравнивать структуру данных для каждой из указанных подгрупп (например, городов).

Для выбора подгрупп можно использовать множество методов, самый простой из них - это введение категориальной переменной (например, переменной City с значениями New York, Chicago и Dallas). На следующем графике показаны гистограммы переменной, представляющей данные о самооценке стресса жителями каждого из трех городов.

На основе этих данных можно сделать вывод о том, что жители Далласа не очень подвержены стрессам, в то время как распределения уровня стресса в Нью-Йорке и Чикаго довольно похожи.

Некоторые программы (например, система STATISTICA) поддерживают двухвходовую или многомерную категоризацию, где для задания подгрупп используется не один (например, City), а два или более критериев (например, City и Time ). Двухвходовые категоризованные графики можно рассматривать как "таблицы графиков", где каждый входящий график находится на "пересечении" определенных значений первой (например, City) и второй (например, Time) группирующих переменных.

Добавление второго фактора показывает, что картины стрессовых нагрузок в Нью-Йорке и Чикаго в действительности сильно различаются, если учитывается время опроса, в то время как фактор времени практически ничего не меняет в Далласе.

Категоризованные и матричные графики. Матричные графики также состоят из нескольких графиков; однако здесь каждый из них основывается (или может основываться) на одном и том же множестве наблюдений, и графики строятся для всех комбинаций переменных из одного или двух списков. Для категоризованных графиков требуется такой же выбор переменных, как и для некатегоризованных графиков соответствующего типа (например, две переменных для диаграммы рассеяния). В то же время для категоризованных графиков необходимо указать по крайней мере одну группирующую переменную (или способ разбиения наблюдений на категории), где содержалась бы информация о принадлежности каждого наблюдения к определенной подгруппе (например, Chicago, Dallas). Группирующая переменная не будет непосредственно изображена на графике (т.е. не будет построена), однако она будет служить критерием для разделения всех анализируемых наблюдений на отдельные подгруппы. Как показано выше, для каждой группы (категории), определяемой группирующей переменной, будет построен один график.

Общие и независимые шкалы. Каждый элементарный график, входящий в состав категоризованного графика, может быть масштабирован в соответствии со своим собственным диапазоном значений (независимые шкалы).

Или все графики могут иметь общую шкалу, достаточно широкую, чтобы охватить весь диапазон значений.

Общий масштаб позволяет сравнивать диапазоны и распределения значений разных категорий. Однако, если эти диапазоны сильно различаются (что приводит к очень большой общей шкале), то исследование некоторых графиков может быть затруднено. Использование независимого масштаба может упростить выявление трендов и определенных закономерностей внутри категорий, но в то же время затруднить сравнение диапазонов значений разных подгрупп.

Тема 4. Сложные планы Межгрупповые планы и планы с повторными измерениями При сравнении двух различных групп обычно используется t-критерий для независимых выборок (из модуля Основные статистики и таблицы). Когда сравниваются две переменные на одном и том же множестве объектов (наблюдений), используетсяt-критерий для зависимых выборок. Для дисперсионного анализа также важно зависимы или нет выборки. Если имеются повторные измерения одних и тех же переменных (при разных условиях или в разное время) для одних и тех же объектов, то говорят о наличии фактора повторных измерений (называемого также внутригрупповым фактором, поскольку для оценки его значимости вычисляется внутригрупповая сумма квадратов). Если сравниваются разные группы объектов (например, мужчины и женщины, три штамма бактерий и т.п.), то разница между группами описывается межгрупповым фактором. Способы вычисления критериев значимости для двух описанных типов факторов различны, но общая их логика и интерпретации совпадает.

Меж- и внутригрупповые планы. Во многих случаях эксперимент требует включение в план и межгруппового фактора, и фактора повторных измерений. Например, измеряются математические навыки студентов женского и мужского пола (где пол -межгрупповой фактор) в начале и в конце семестра.

Два измерения навыков каждого студента образуют внутригрупповой фактор (или фактор с повторными измерениями). Интерпретация главных эффектов и взаимодействий для межгрупповых факторов и факторов повторных измерений совпадает, и оба типа факторов могут, очевидно, взаимодействовать между собой (например, женщины приобретают навыки в течение семестра, а мужчины их теряют).

Неполные (гнездовые) планы Во многих случаях можно пренебречь эффектом взаимодействия. Это происходит или когда известно, что в популяции эффект взаимодействия отсутствует, или когда осуществление полного факторного плана невозможно.

Например, пусть изучается влияние четырех добавок к топливу на расход горючего. Выбираются четыре автомобиля и четыре водителя. Полный факторныйэксперимент требует, чтобы каждая комбинация: добавка, водитель, автомобиль - появились хотя бы один раз. Для этого нужно не менее 4 x 4 x 4 = 64 групп испытаний, что требует слишком больших временных затрат.

Кроме того, вряд ли существует взаимодействие между водителем и добавкой к топливу. Принимая это во внимание, можно использовать план типа Латинские квадраты, в котором содержится лишь 16 групп испытаний (четыре добавки обозначаются буквами A, B, C и D):

Латинские квадраты описаны в большинстве книг по планированию экспериментов (например, Hays, 1988; Lindman, 1974; Milliken and Johnson, 1984;

Winer, 1962), и здесь они не будут детально обсуждаться. Отметим, что латинские квадраты это неnолные планы, в которых участвуют не все комбинации уровней факторов. Например, водитель 1 управляет автомобилем 1 только с добавкой А, водитель 3 управляет автомобилем 1 только с добавкой С. Уровни фактора добавки (A, B, C и D) вложены в ячейки таблицыавтомобиль x водитель как яйца в гнезда. Это мнемоническое правило полезно для понимания природы гнездовых планов. МодульДисперсионный анализ предоставляет простые способы анализ планов такого типа.

Отметим, что анализ планов такого типа возможен и в некоторых других модулях системы STATISTICA. Подробнее см. в разделеМетоды дисперсионного анализа. В частности, модуль Компоненты дисперсии и смешанные модели ANOVA/ANCOVA очень эффективен при анализе планов с несбалансированной вложенностью (т.е. когда вложенные факторы имеют различное число уровней при разных уровнях факторов, в которые они вложены), очень больших гнездовых планов (например, с общим числом уровней более 200) или иерархически вложенных планов (содержащих или не содержащих случайные факторы).

Тема 5. Ковариационный анализ (ANCOVA) Фиксированные ковариаты Предположим, что сравниваются математические навыки двух групп студентов, которые обучались по двум различным учебникам. Предположим также, что имеются дополнительные данные о коэффициенте интеллекта (IQ) каждого студента. Можно предположить, что коэффициент интеллекта связан с математическими навыками, и использовать эту информацию. Для каждой из двух групп студентов можно вычислить коэффициент корреляции между IQ и математическими навыками (см. Основные статистики и таблицы). Используя этот коэффициент корреляции, можно выделить долю дисперсии в группах, объясняемую IQ и необъясняемую долю дисперсии (см. также Элементарные понятия статистики и Основные статистики и таблицы). Оставшаяся доля дисперсии используется при проведении анализа как дисперсия ошибки. Если имеется корреляция между IQ и математическими навыками, то таким образом можно существенно уменьшить дисперсию ошибки SS/(n-1).

Влияние ковариат на F критерий. F критерий оценивает статистическую значимость различия средних в группах, при этом вычисляется отношение межгрупповой дисперсии (MSошибка) к дисперсии ошибок (MSошибка). Если MSошибка уменьшается, например, при учете фактора IQ, значение F увеличивается.

Множество ковариат. Рассуждения, использованные выше для одной ковариаты (IQ), легко распространяются на несколько ковариат. Например, кроме IQ, можно включить измерение мотивации, пространственного мышления и т.д.

Вместо обычного коэффициента корреляции при этом используется множественный коэффициент корреляции (см. раздел Множественная регрессия).

Когда значение F-критерия уменьшается. Иногда введение ковариат в план эксперимента уменьшает значение F-критерия.Обычно это указывает на то, что ковариаты коррелированы не только с зависимой переменной (например, математическими навыками), но и с факторами (например, с разными учебниками). Предположим, что IQ измеряется в конце семестра, после почти годового обучения двух групп студентов по двум разным учебникам. Хотя студенты разбивались на группы случайным образом, может оказаться, что различие учебников настолько велико, что и IQ и математические навыки в разных группах будут сильно различаться. В этом случае, ковариаты не только уменьшают дисперсию ошибок, но и межгрупповую дисперсию. Другими словами, после контроля за разностью IQ в разных группах, разность в математических навыках уже будет несущественной. Ту же мысль можно выразить иначе: после "исключения" влияния IQ, неумышленно исключается и влияние учебника на развитие математических навыков.

Скорректированные средние. Когда ковариата влияет на межгрупповой фактор, следует вычислять скорректированные средние, т.е. такие средние, которые получаются после удаления всех оценок ковариат.

Взаимодействие между ковариатами и факторами. Также как исследуется взаимодействие между факторами, можно исследовать взаимодействия между ковариатами и группами факторов. Предположим, что один из учебников особенно подходит для умных студентов. Второй учебник для умных студентов скушен, а для менее умных студентов этот же учебник труден. В результате имеется положительная корреляция между IQ и результатом обучения в первой группе (более умные студенты, лучше результат) и нулевая или небольшая отрицательная корреляция во второй группе (чем умнее студент, тем менее вероятно приобретение математических навыков из второго учебника). В некоторых исследованиях эта ситуация обсуждается как пример нарушения предположений ковариационного анализа (см. Предположения и последствия их нарушения). Однако так как в модуле Дисперсионный анализ используются самые общие способы ковариационного анализа, можно, в частности, оценить статистическую значимостьвзаимодействия между факторами и ковариатами.

Переменные ковариаты В то время как фиксированные ковариаты обсуждаются в учебниках достаточно часто, переменные ковариаты упоминаются намного реже. Обычно, при проведении экспериментов с повторными измерениями, нас интересуют различия в измерениях одних и тех же величин в разные моменты времени. А именно, нас интересует значимость этих различий. Если одновременно с измерениями зависимых переменных проводится измерение ковариат, можно вычислить корреляцию между ковариатой и зависимой переменной. Например, можно изучать интерес к математике и математические навыки в начале и в конце семестра. Интересно было бы проверить, коррелированы ли между собой изменения в интересе к математике с изменением математических навыков.

Модуль Дисперсионный анализ в STATISTICA автоматически оценивает статистическую значимость изменения ковариат в тех планах, где это возможно.

Тема 6. Многомерные планы: Многомерный дисперсионный и ковариационный анализ Межгрупповые планы Все рассматриваемые ранее примеры включали только одну зависимую переменную. Когда одновременно имеется несколько зависимых переменных, возрастает лишь сложность вычислений, а содержание и основные принципы не меняются. Например, проводится исследование двух различных учебников.

При этом изучаются успехи студентов в изучении физики и математики. В этом случае имеются две зависимые переменные и нужно выяснить, как влияют на них одновременно два разных учебника. Для этого можно воспользоваться многомерным дисперсионным анализом (MANOVA). Вместо одномерного F критерия, используется многомерный F критерий (лямбда-критерий Уилкса), основанный на сравнении ковариационной матрицы ошибок и межгрупповой ковариационной матрицы. Если зависимые переменные коррелированы между собой, то эта корреляция должна учитываться при вычислении критерия значимости. Очевидно, если одно и то же измерение повторяется дважды, то ничего нового получить при этом нельзя. Если к имеющемуся измерению добавляется коррелированное с ним измерение, то получается некоторая новая информация, но при этом новая переменная содержит избыточную информацию, которая отражается в ковариации между переменными.

Интерпретация результатов. Если общий многомерный критерий значим, можно заключить, что соответствующий эффект (например, тип учебника) значим. Однако встают следующие вопросы. Влияет ли тип учебника на улучшение только математических навыков, только физических навыков, или одновременно на улучшение тех и других навыков. В действительности, после получения значимого многомерного критерия, для отдельного главного эффекта или взаимодействия исследуются одномерные F-критерии. Другими словами, отдельно исследуются зависимые переменные, которые вносят вклад в значимость многомерного критерия.

Планы с повторными измерениями Если измеряются математические и физические навыки студентов в начале семестра и в конце семестра, то это и есть повторные измерения. Изучение критерия значимости в таких планах это логическое развитие одномерного случая.

Заметим, что методы многомерного дисперсионного анализа обычно также используются для исследования значимости одномерных факторов повторных измерений, имеющих более чем два уровня. Соответствующие применения будут рассмотрены позднее в этой части.

Суммы значений переменной и дисперсионный анализ Даже опытные пользователи одномерного и многомерного дисперсионного анализа часто приходят в затруднение, получая разные результаты при применении многомерного дисперсионного анализа, например, для трех переменных, и при применении одномерного дисперсионного анализа к сумме этих трех переменных, как к одной переменной. Идея суммирования переменных состоит в том, что каждая переменная содержит в себе некоторую истинную переменную, которая и исследуется, а также случайную ошибку измерения. Поэтому при усреднении значений переменных, ошибка измерения будет ближе к 0 для всех измерений и усредненное значений будет более надежным. На самом деле, в этом случае применение дисперсионного анализа к сумме переменных разумно и является мощным методом. Однако, если зависимые переменные по своей природе многомерны, то суммирование неуместно. Например, пусть зависимые переменные состоят из четырех показателей успеха в обществе. Каждый показатель характеризует совершенно независимую сторону человеческой деятельности (например, профессиональный успех, преуспевание в бизнесе, семейное благополучие и т.д.). Сложение этих переменных подобно сложению яблока и апельсина. Сумма этих переменных не будет подходящим одномерным показателем. Поэтому с такими данными нужно обходится как с многомерными показателями в многомерном дисперсионном анализе.

Тема 7. Диспресионный анализ Этот раздел содержит вводный обзор и обсуждение некоторых методов дисперсионного анализа, включая планы с повторными измерениями, ковариационный анализ, многомерный дисперсионный анализ, несбалансированные и вложенные планы, эффекты контрастов, апостериорные сравнения и др. Дополнительно, можно обратиться к разделу Компоненты дисперсии (разделы связанные с оцениванием компонент дисперсии в смешанных планах), Планирование эксперимента (разделы связанные со специальными областями применения дисперсионного анализа в промышленных условиях), а также Анализ повторяемости и воспроизводимости (разделы, относящиеся к оцениванию надежности и точности измерительных систем).

Основные идеи Цель дисперсионного анализа.

Основной целью дисперсионного анализа является исследование значимости различия между средними. Раздел Элементарные понятия статистики содержит краткое введение в исследование статистической значимости. Если вы просто сравниваете средние в двух выборках, дисперсионный анализ даст тот же результат, что и обычный t-критерий для независимых выборок (если сравниваются две независимые группы объектов или наблюдений) или tкритерий для зависимых выборок (если сравниваются две переменные на одном и том же множестве объектов или наблюдений). Если вы не достаточно знакомы с этими критериями, рекомендуем обратиться к разделу Основные статистики и таблицы.

Откуда произошло название Дисперсионный анализ?Может показаться странным, что процедура сравнения средних называется дисперсионным анализом. В действительности, это связано с тем, что при исследовании статистической значимости различия между средними двух (или нескольких) групп, мы на самом деле сравниваем (т.е. анализируем) выборочные дисперсии. Фундаментальная концепция дисперсионного анализа предложена Фишером в 1920 году.

Возможно, более естественным был бы термин анализ суммы квадратов или анализ вариации, но в силу традиции употребляется термин дисперсионный анализ.

Разбиение суммы квадратов Для выборки объема n выборочная дисперсия вычисляется как сумма квадратов отклонений от выборочного среднего, деленная наn-1 (объем выборки минус единица). Таким образом, при фиксированном объеме выборки n дисперсия есть функция суммы квадратов (отклонений), обозначаемая, для краткости, SS (от английского Sum of Squares - Сумма квадратов). Далее слово выборочная мы часто опускаем, прекрасно понимая, что рассматривается выборочная дисперсия или оценка дисперсии. В основе дисперсионного анализа лежит разделение дисперсии на части или компоненты. Рассмотрим следующий набор данных:

Средние двух групп существенно различны (2 и 6 соответственно). Сумма квадратов отклонений внутри каждой группы равна 2. Складывая их, получаем 4. Если теперь повторить эти вычисления без учета групповой принадлежности, то есть, если вычислитьSS исходя из общего среднего этих двух выборок, то получим величину 28. Иными словами, дисперсия (сумма квадратов), основанная на внутригрупповой изменчивости, приводит к гораздо меньшим значениям, чем при вычислении на основе общей изменчивости (относительно общего среднего). Причина этого, очевидно, заключается в существенной разнице между средними значениями, и это различие между средними и объясняет существующее различие между суммами квадратов. В самом деле, если использовать для анализа этих данных модуль Дисперсионный анализ, то будет получена следующая таблица, называемая таблицей дисперсионного анализа:

ГЛАВНЫЙ ЭФФЕКТ

Как видно из таблицы, общая сумма квадратов SS = 28 разбита на компоненты:

сумму квадратов, обусловленную внутригрупповойизменчивостью (2+2=4; см.

вторую строку таблицы) и сумму квадратов, обусловленную различием средних значений между группами (28-(2+2)=24; см первую строку таблицы). Заметим, что MS в этой таблице есть средний квадрат, равный SS, деленная на число степеней свободы (ст.св).

SS ошибок и SS эффекта. Внутригрупповая изменчивость (SS) обычно называется остаточной компонентой или дисперсиейошибки. Это означает, что обычно при проведении эксперимента она не может быть предсказана или объяснена. С другой стороны,SS эффекта (или компоненту дисперсии между группами) можно объяснить различием между средними значениями в группах.

Иными словами, принадлежность к некоторой группе объясняет межгрупповую изменчивость, т.к. нам известно, что эти группы обладают разными средними значениями.

Проверка значимости.Основные идеи проверки статистической значимости обсуждаются в разделе Элементарные понятия статистики. В этом же разделе объясняются причины, по которым многие критерии используют отношение объясненной и необъясненной дисперсии. Примером такого использования является сам дисперсионный анализ. Проверка значимости в дисперсионном анализе основана на сравнении компоненты дисперсии, обусловленной межгрупповым разбросом (называемойсредним квадратом эффекта или MSэффект) и компоненты дисперсии, обусловленной внутригрупповым разбросом (называемойсредним квадратом ошибки или MSошибка; эти термины были впервые использованы в работе Edgeworth, 1885). Если верна нулевая гипотеза (равенство средних в двух популяциях), то можно ожидать сравнительно небольшое различие выборочных средних из-за чисто случайной изменчивости. Поэтому, при нулевой гипотезе, внутригрупповая дисперсия будет практически совпадать с общей дисперсией, подсчитанной без учета групповой принадлежности. Полученные внутригрупповые дисперсии можно сравнить с помощью F-критерия, проверяющего, действительно ли отношение дисперсий значимо больше 1. В рассмотренном выше примереF-критерий показывает, что различие между средними статистически значимо (значимо на уровне 0.008).

Основная логика дисперсионного анализа. Подводя итоги, можно сказать, что целью дисперсионного анализа является проверка статистической значимости различия между средними (для групп или переменных). Эта проверка проводится с помощью разбиения суммы квадратов на компоненты, т.е. с помощью разбиения общей дисперсии (вариации) на части, одна из которых обусловлена случайной ошибкой (то есть внутригрупповой изменчивостью), а вторая связана с различием средних значений. Последняя компонента дисперсии затем используется для анализа статистической значимости различия между средними значениями. Если это различие значимо, нулевая гипотеза отвергается и принимается альтернативная гипотеза о существовании различия между средними.

Зависимые и независимые переменные. Переменные, значения которых определяется с помощью измерений в ходе эксперимента (например, балл, набранный при тестировании), называются зависимыми переменными. Переменные, которыми можно управлять при проведении эксперимента (например, методы обучения или другие критерии, позволяющие разделить наблюдения на группы или классифицировать) называются факторами или независимыми переменными. Более подробно эти понятия описаны в разделе Элементарные понятия статистики.

Многофакторный дисперсионный анализ В рассмотренном выше простом примере вы могли бы сразу вычислить tкритерий для независимых выборок, используя соответствующую опцию модуля Основные статистики и таблицы. Полученные результаты, естественно, совпадут с результатами дисперсионного анализа. Однако дисперсионный анализ содержит гораздо более гибкие и мощные технические средства, позволяющие исследовать планы практически неограниченной сложности.

Множество факторов. Мир по своей природе сложен и многомерен. Ситуации, когда некоторое явление полностью описывается одной переменной, чрезвычайно редки. Например, если мы пытаемся научиться выращивать большие помидоры, следует рассматривать факторы, связанные с генетической структурой растений, типом почвы, освещенностью, температурой и т.д. Таким образом, при проведении типичного эксперимента приходится иметь дело с большим количеством факторов. Основная причина, по которой использование дисперсионного анализа предпочтительнее повторного сравнения двух выборок при разных уровнях факторов с помощью серий t-критерия, заключается в том, что дисперсионный анализ существенно более эффективен и, для малых выборок, более информативен. Вам нужно сделать определенные усилия, чтобы овладеть техникой дисперсионного анализа, реализованной на STATISTICA, и ощутить все ее преимущества в конкретных исследованиях.

Управление факторами. Предположим, что в рассмотренном выше примере анализа двух выборок мы добавим еще один фактор, например, Пол Gender. Пусть каждая группа теперь состоит из 3 мужчин и 3 женщин. План этого эксперимента можно представить в виде таблицы 2 на 2:

Экспериментальная Экспериментальная До проведения вычислений можно заметить, что в этом примере общая дисперсия имеет, по крайней мере, три источника: (1) случайная ошибка (внутригрупповая дисперсия), (2) изменчивость, связанная с принадлежностью к экспериментальной группе, и (3) изменчивость, обусловленная полом объектов наблюдения. (Отметим, что существует еще один возможный источник изменчивости - взаимодействие факторов, который мы обсудим позднее). Что произойдет, если мы не будем включать пол как фактор при проведении анализа и вычислим обычный t-критерий? Если мы будем вычислять суммы квадратов, игнорируя пол (т.е. объединяя объекты разного пола в одну группу при вычислении внутригрупповой дисперсии и получив при этом сумму квадратов для каждой группы равную SS =10 и общую сумму квадратов SS = 10+10 = 20), то получим большее значение внутригрупповая дисперсии, чем при более точном анализе с дополнительным разбиением на подгруппы по полу (при этом внутригрупповые средние будут равны 2, а общая внутригрупповая сумма квадратов равна SS = 2+2+2+2 = 8).

Итак, при введении дополнительного фактора: пол, остаточная дисперсия уменьшилась. Это связано с тем, что среднее значение длямужчин меньше, чем среднее значение для женщин, и это различие в средних значениях увеличивает суммарную внутригрупповую изменчивость, если фактор пола не учитывается.

Управление дисперсией ошибки увеличивает чувствительность (мощность) критерия. На этом примере видно еще одно преимущество дисперсионного анализа по сравнению с обычным t-критерием для двух выборок. Дисперсионный анализ позволяет изучать каждый фактор, управляя значениями других факторов. Это, в действительности, и является основной причиной его большей статистической мощности (для получения значимых результатов требуются меньшие объемы выборок). По этой причине дисперсионный анализ даже на небольших выборках дает статистически более значимые результаты, чем простой t-критерий.

Тема 8. Множественная регрессия Общее назначение;

Вычислительные аспекты;

Метод наименьших квадратов;

Уравнение регрессии;

Однозначный прогноз и частная корреляция;

Предсказанные значения и остатки;

Остаточная дисперсия и коэффициент детерминации R-квадрат;

Интерпретация коэффициента множественной корреляции R;

Предположения, ограничения и обсуждение практических вопросов;

Предположение линейности;

Предположение нормальности;

Ограничения;

Выбор числа переменных;

Мультиколлинеарность и плохая обусловленность матрицы;

Подгонка центрированных полиномиальных моделей;

Важность анализа остатков.

Тема 9. Непараметрическая статистика и подгонка распределения Основная цель;

Краткий обзор непараметрических процедур;

Какой метод использовать;

Подгонка распределения.

Тема 10. Общие линейные модели Основные идеи: Общая линейная модель;

История развития;

Задача множественной регрессии;

Вычислительные методы решения уравнения множественной регрессии;

Расширение множественной регрессии до общей линейной модели;

Сигма-ограниченная и сверхпараметризованная модель;

Результаты вычислений;

Виды анализа;

Межгрупповые планы;

Планы с повторными измерениями;

Многомерные планы;

Проверка гипотез;

Разбиение сумм квадратов (SS);

Шесть типов сумм квадратов;

Потеря согласия критериев, использующих чистую ошибку;

Оцениваемость гипотез;

Проверка гипотез для повторных измерений.

Тема 11. Межгрупповые планы Вводный обзор;

Простая регрессия;

Множественная регрессия;

Факторная регрессия;

Полиномиальная регрессия;

Регрессия поверхности отклика;

Регрессия поверхности смеси;

Однофакторный Дисперсионный анализ;

Дисперсионный анализ главных эффектов;

Факторный Дисперсионный анализ;

Ковариационный анализ (ANCOVA);

Однородность угловых коэффициентов.

Тема 12. Кластерный анализ Основная цель;

Проверка статистической значимости;

Области применения;

Объединение (древовидная кластеризация);

Иерархическое дерево;

Меры расстояния;

Правила объединения или связи;

Двувходовое объединение;

Двувходовое объединение;

Интерпретация результатов.

Тема 13. Главные компоненты и факторный анализ Факторный анализ как метод редукции данных;

Факторный анализ как метод классификации;

Другие результаты и статистики.

5.3 Краткое описание лабораторных работ 5.3.1 Перечень рекомендуемых лабораторных работ 1. Введение в систему Statistica 2. Графический анализ таблиц сопряженности 3. Простейшие задачи математической статистики 4. Вычисления описательных статистик и построение простейших статистических графиков 5. Вероятнорстный калькулятор 6. Простая линейная Регрессия в системе Statistica 5.3.2. Методические указания по выполнению заданий при выполнении лабораторных работ Система STATISTICA представляет собой интегрированную систему статистического анализа и обработки данных. Она состоит из 5 компонентов:

1) электронных таблиц для ввода и задания исходных данных, а также специальных таблиц для вывода результатов статистического анализа;

2) графической системы визуализации данных и результатов статистического анализа;

3) набора статистических модулей, в которых собраны группы логически связанных между собой статистических процедур;

4) специального инструментария для подготовки отчетов;

5) встроенных языков программирования, позволяющих расширить стандартные возможности системы.

В любом конкретном модуле можно выполнить определенный способ статистической обработки, не обращаясь к процедурам других модулей.

Переключаться между модулями можно как между обычными Windowsприложениями, выбирая их на панели переключателей модулей щелчком мыши.

Графические возможности доступны в любом статистическом модуле на любом шаге анализа.

Открытие, хранение и создание файлов данных в системе STATISTICA Запустить систему STATISTICA можно с помощью кнопки Пуск и выбора в меню курсором мыши команды Программы. В появившемся меню выбрать STATISTICA. Появится переключатель модулей системы.

Выберем в нем модуль Basic Statistics and Tables (Основные статистики и таблицы) и дважды щелкнуть (кликнуть) левой кнопкой мыши. После этого на экране компьютера появится Стартовая панель модуля.

Отказаться от предлагаемого сервиса услуг можно, нажав CANCEL.

Стартовая панель исчезнет, открыв Рабочее Окно системы STATISTICA.

Рабочее Окно системы STATISTICA имеет следующую структуру:

1. Верхний заголовок в рабочем окне STATISTICA является названием запущенного модуля, например, Basic Statistics and Tables (Основные статистики и таблицы). Далее: строка меню, панель инструментов, рабочая область. В рабочую область выводятся все документы системы, которые получаются в процессе анализа.

2. Меню занимает вторую строку основного окна модуля и содержит в себе систему выпадающих меню. Ряд пунктов меню, таких как File(Файл), Edit(Правка). Vew(Вид), Windows(Окно), Help(Справка), стандартен для Windows. Пункт Analysis(Анализ) специфичен для STATISTICA. Он позволяет среди прочих услуг вызвать стартовую панель (Startup Panel) модуля, находясь в этом модуле.

После того как пункт меню выбран, в нем можно инициировать необходимую команду различными способами:

-щелкнуть на имени команды мышью;

-нажать на клавишу с буквой, которая подчеркнута в названии команды:

-воспользоваться стрелками {вверх} и {вниз}для выбора нужной команды и клавишей Enter.

3. Панель инструментов занимает третью и четвертую строчку рабочего окна и располагается ниже строки меню. Панель инструментов содержит кнопки для быстрого доступа к наиболее часто используемым командам меню.

При помощи щелчка мышью на какой-либо кнопке можно получить быстрый доступ к соответствующей команде. Каждому типу документа STATISTICA соответствует своя панель инструментов.

Файлы STATISTICA с исходными данными имеют расширение sta. При запусках автоматически открывается последний файл, с которым работали в системе. В рабочей области может находиться только один файл с исходными данными (однако может быть неограниченное число файлов с промежуточными значениями и графиков).

Открываются файлы стандартным для Windows способом. В строке меню выбирается пункт File(Файл). После щелчка левой кнопкой мыши в спустившемся меню выбираем команду Open(Open Data), далее в каталоге выделяется имя файла и нажимается кнопка ОК.

Исходные данные в системе STATISTICA организованы в виде электронной таблицы.

Столбцы электронной таблицы с исходными данными называются Variables(Переменные), а строки Cases(Случаи). В качестве переменных обычно выступают исследуемые величины, а случаи - это значения, которые принимают переменные в отдельных измерениях.

Электронные таблицы могут содержать и численную и текстовую информацию. Они поддерживают различные типы операций с данными. Чтобы создать файл данных, находясь в основном рабочем окне системы STATISTICA, нужно выбрать курсором в строке меню пункт File(Файл) и щелкнуть левой кнопкой мыши. В выпавшем меню выбрать команду New(NewData), далее в окне: Specify File Name (Новый(Новые данные)) следует ввести имя файла и нажать кнопку ОК. STATISTICA автоматически откроет пустую электронную таблицу с указанным именем. В заголовке окна электронной таблицы отобразится имя файла и его размер.

Размер таблицы по умолчанию принят 10*10 (10 переменных сименами VAR1, VAR2, VAR3,…, VAR10 и 10 пронумерованных случаев).

Размер таблицы (число строк и столбцов) можно увеличивать и уменьшать. Число столбцов регулируется кнопкой Vars(Переменные).

После нажатия кнопки Vars на панели инструментов в выпадающем меню выбирают одну из команд: Delete Variable(удалить переменные) или Add Variable(Добавить переменные). Аналогично регулируется кнопкой Cases(Случаи) число случаев. Можно задавать заголовок таблицы, имена переменных и случаев. В качестве имен случаев можно использовать либо числа, либо текст, либо дату. Свойства переменной (имя, формат, код пропущенных значений, метка, формула для вычисления или связь) называют спецификацией переменной и устанавливают с помощью команды All Specs(Все спецификации) или Current Specs(Текущие спецификации). Эти команды доступны после нажатия кнопки Vars(Переменные) на панели инструментов или правой кнопки мыши. Переменные и случаи можно также копировать (Copy), удалять (Delete) и пр.

Выполнение заданий в пакете STATISTICA Пример 1. Создать файл Gemat.sta 6v*15c с результатами воздействия лекарства «каптоприл» на кровяное давление. Исходные данные содержатся в таблице.

Шаг 1. Создание электронной таблицы Выберите команду New(NewData)(Новый(Новые данные)) из меню File(Файл).

В диалоговом окне команду New(NewData): Specify File Name (Новый(Новые данные):Определить имя файла), в строке File Name(Имя файла) напишите имя файла Gemat.sta. Нажмите кнопку ОК. На экране появится пустая электронная таблица размером 10*10.

Шаг 2. Настройка размеров таблицы Для данных требуется 6 столбцов и 15 строк. Нужно удалить лишние 4 переменных и добавить 5 случаев.

Нажмите кнопку Vars(Переменные) на панели инструментов и выберите команду Delete(Удалить). В диалоговом окне Delete Variables(Удаление переменных) укажите диапазон удаляемых переменных From variable: VAR (Начиная с переменной VAR 7).

To Variable: VAR10 (По переменную VAR10).

Далее нужно к указанным 10 случаям (Cases) добавить5.

Нажмите кнопку Cases(Случаи) на панели инструментов и выберите команду Add(Добавить). В появившемся окне сделайте установки:

Number of Cases to Add: 5 (5 случаев).

Insert After Case: 10 (После случая: 10) Шаг 3. Оформление заголовка таблицы Кликните на белом фоне в таблице под строкой: Data : Gemat.sta 6v*15c. В открывшемся окне Data File Header (Заголовок файла данных) введите заголовок таблицы

КРОВЯНОЕ ДАВЛЕНИЕ

Шаг 4. Задание имен переменных Кликните в клетке VAR1 электронной таблицы. Сделайте выбор Variable Specs…. В поле Name (Имя) открывшегося окна напишите: ниж до. Нажмите кнопку >>, переменной VAR2 присвойте имя ниж пос, >>, переменной VAR присвойте имя верх до, >>, переменной VAR5 присвойте имя верх пос.

Таблица. Кровяное давление (в мм. ртутного столба) до и после приема каптоприла.

Шаг 5. Ввод данных в электронную таблицу Введите данные в электронную таблицу с клавиатуры. Значения переменных VAR3 и VAR6 не вводите.

Шаг 6. Вычисление значений переменной по формуле Кликните в клетке VAR3 электронной таблицы. Сделайте выбор Variable Specs…. В поле Long Name запишите формулу для вычисления: =v2-v1 OK.

Аналогичным образом вычисляются и вводятся значения VAR6. (Этим переменным можно присвоить имя разность ). (Variable Specs… Name).

Шаг 7. Сохранение файла данных Для сохранения файла Gemat.sta. 6v*15c нажмите кнопку Save Data Files (Сохранить данные) или (Save)( Сохранить). Можно также сохранить, набрав на клавиатуре CTRL+S.

Еще один пример Из переключателя модулей системы STATISTICA запустите модуль Basic Statistics and Tables(Основные статистики и таблицы). Запуск модуля осуществляется путем выбора на панели модулей кнопки Switch to (Переключится) или двумя щелчками левой кнопки («кликом») мыши по названию самого В файле содержатся результаты опроса 10 женщин (данные являются модельными) относительно их семейного положения и состояния уровня тревожности. Первая переменная СЕМ_ПОЛ описывает семейное положение женщины. Эта переменная принимает два значения: П_семья – полная семья, Н_семья – неполная семья. Вторая переменная – ТРЕВОГА, описывает самооценку личностной тревожности женщины. Она принимает два значение: низкая, высокая. Известно, что личностная тревожность характеризуется устойчивой склонностью воспринимать жизненную ситуацию как угрожающую (содержащую в себе тайную угрозу). Из примера видно, что первая опрошенная женщина - наблюдение номер 1 (первая строка в таблице) имеет полную семью и характеризует свое душевное состояние как тревожное.

Вторая опрошенная женщина – наблюдение номер 2 (вторая строка таблицы) – имеет неполную семью и оценивает уровень своей тревожности как низкий и т.д.

Назовите этот файл women1.sta Эффективнее организовывать ввод текстовых значений можно, закодировав переменные следующим образом. Начнем с переменной СЕМ_ПОЛ. Дважды щелкните по заголовку левой кнопкой мыши, и на экране отобразится окно Variable1 (переменная1)- СЕМ_ПОЛ. Выберите кнопку Text Values(Текстовые значения). В открывшемся окне Text Values Manager(Диспетчер текстовых значений)-СЕМ_ПОЛ в колонке Text наберите в первой строке П_семья, а в колонке Numeric наберите 1.

Это приведет к тому, что текстовому значению П_семья будет присвоен код 1. Аналогично во второй строке наберите Н_семья и число 2.

Текстовому значению Н_семья будет присвоен код 2. Далее нажмите кнопку ОК.

Теперь введите значения 1 в те ячейки переменной СЕМ_ПОЛ, в которых должно стоять текстовое значение П_семья. Введите значение 2 в те ячейки переменной СЕМ_ПОЛ, в которых должно стоять текстовое значение Н_семья.

Теперь достаточно нажать кнопку ABC на панели инструментов STATISTICA, чтобы получить нужные текстовые значения.

Таким же образом введите текстовые значения в ячейку переменной ТРЕВОГА.

Построение таблиц сопряженности в системе STATISTICA Шаг 1. Подведите курсор мыши к пункту Analysis(Анализ), в появившемся меню сделайте выбор: Startup Panel (Стартовая панель). Из различных видов анализа, доступных в этом модуле, выберите Tables and Banners(Таблицы и заголовки) и нажмите кнопку ОК. На экране появится окно Specify Table(Задать таблицы).

Шаг 2. Сначала в строке Analisys выберите Crosstabulation tables (Таблицы сопряженности).

Шаг 3. Далее нажмите кнопку Specify tables(Задать таблицы). В появившемся окне выберем переменные, которые будут табулированы в таблице. Эти переменные задают разбиение исходных данных на группы, поэтому их часто называют также группирующими переменными. В данном случае будем табулировать значения переменных и ТРЕВОГА. Выберем в первой колонке из предложенных переменных переменную: 1-СЕМ_ПОЛ, во второй колонке: 2ТРЕВОГА. (Заметьте, что вообще можно выбирать до 6 списков группирующихся переменных, что позволяет строить чрезвычайно сложные таблицы, содержащие гораздо больше переменных, чем в указанном примере.) После выбора переменных нажмите кнопку ОК. Вы вновь вернетесь в диалоговое окно, оно немного изменилось: возле надписи Number of tables появилась цифра 1, потому что вы выбрали переменные и попросили систему построить одну таблицу.

Шаг 4. Нажмите ENTER на клавиатуре или кнопку ОК в верхнем правом углу диалогового окна. Система произведет вычисления и предложит просмотреть результат в окне Crosstabulation Tables Results (Результаты кросстабуляции).

Шаг 5. В окне Crosstabulation Tables Results (Результаты кросстабуляции) нажмите кнопку Review Summary Tables(Просмотреть итоговые таблицы). На экране появится таблица сопряженности:

В этой таблице табулированы переменные СЕМ_ПОЛ и ТРЕВОГА на пересечении строк и столбцов стоят абсолютные значения, вычисленные из исходного файла данных women1.sta.

Мы табулировали совместно значения двух переменных СЕМ_ПОЛ и ТРЕВОГА, такое действие называется кросстабуляцией.

Задание. Проанализируйте таблицу сопряженности.

Часто возникает необходимость вместе с абсолютными значениями привести в таблице проценты. Проценты по столбцу – это проценты, вычисленные относительно суммарного значения частот по столбцу.

Проценты по строке - это проценты, вычисленные относительно суммарного значения частот по строке. Проценты от общего числа вычисляются относительно суммы частот в таблице.

Шаг 6. Опять вернемся в окно Crosstabulation Tables Results (Результаты кросстабуляции) Шаг 7. В окне Crosstabulation Tables Results (Результаты кросстабуляции) выберем в группе Tables опцию Percentages of total count(Проценты от общего числа).

Щелкните мышью в соответствующем квадрате. Далее нажмите кнопку Review Summary Tables(Просмотреть итоговые таблицы). На экране появится следующая таблица.

Здесь рядом с абсолютными значениями появились относительные величины – проценты, вычисленные от общего числа женщин, т.е. от 10.

Таким образом, из таблицы видно, что 20% женщин имеют полную семью и высокий уровень тревоги;

30% женщин имеют полную семью и низкий уровень тревоги;

30% женщин имеют неполную семью и высокий уровень тревоги;

20% женщин имеют неполную семью и низкий уровень тревоги.

Шаг 8. Редактирование таблицы Дважды щелкните, например, по полю Total% в построенной таблице. В появившемся окне в поле Name вместо Total % введите % Шаг 9. Построение отдельных таблиц с процентами.

Вернемся вновь в окно Crosstabulation Tables Results (Результаты кросстабуляции) и выберем опцию Percentages of total count(Проценты от общего числа), и далее опцию Display selected %’s in sep tables(Отображать выбранные %в отдельных таблицах). Затем выберем кнопку Review Summary Tables(Просмотреть итоговые таблицы).

Шаг 10. Создание автоотчета.

Войдите в меню View(Вид) и выберите опцию Text/Output Window(Окно текста/вывода) Из построенных таблиц выберите ту, которая нужна для отчета. Щелкните по ней мышью. Войдите в меню File(Файл) и выберите опцию Print(Печать). Отмеченная таблица результатов будет распечатана.

Пример. Создайте в системе STATISTICA файл women2.sta. Для градации значений переменных используются более реалистичные шкалы.

Шкала семейного положения женщины: одинокая, неполная семья, полная семья. Шкала тревожности женщины: низкая, умеренная, высокая.

Пример (продолжение). Файл данных women1.sta открыт в рабочем окне модуля Basic Statistics and Tables(Основные статистики и таблицы).

Шаг 1. Подведите курсор мыши к пункту Analisys(Анализ) в появившемся меню сделайте выбор: Startu panel (Стартовая панель).

Выберите анализ Tables and Banners(Таблицы и заголовки) и нажмите С помощью опций окна произведите табулировку переменных СЕМ_ПОЛ и ТРЕВОГА.

Шаг 2. После того как система построит таблицу в диалоговом окне Crosstabulation Tables Results (Результаты кросстабуляции), нажмите кнопку Categorised gistograms (Категоризованные гистограммы).

Смысл этих гистограмм следующий: опрошенные женщины разбиты на женщины из неполной семьи. Категоризованная гистограмма показывает, что уровень тревожности в полных выбор: Startup Panel (Стартовая панель). Из различных видов анализа, доступных в этом модуле, выберите Tables and Banners(Таблицы и заголовки) и нажмите кнопку ОК. На экране появится окно Specify Table(Задать таблицы).

Шаг 2. Табулируйте значения переменных SEM_POL и TREVOGA.

Нажмите кнопку Codes(Коды) и выберите значения табулируемых качественных признаков.

Можно выбрать табулирование всех значений переменных. Для этого нажмите кнопку Select All.

Шаг 3. Постройте таблицу кросстабуляции и график категоризованной гистограммы. (Crosstabulation Tables Results (Результаты кросстабуляции) далее нажмите кнопку Categorised gistograms (Категоризованные гистограммы).

Шаг 4. В диалоговом окне Crosstabulation Tables Results ма.

Смысл этой гистограммы в следующем: составляются всевозможные комбинации значений двух переменных и подсчитывается, сколько раз встречалась каждая комбинация. Трехмерная гистограмма очень наглядно воспроизводит таблицу кросстабуляции: вы положили таблицу на плоскость и в каждую клетку поставили по столбцу, высота которого равна количеству наблюдений в клетке таблицы. Можно использовать анимацию для вращения графика (кнопки вращения расположены на панели инструментов).

Шаг 5. В диалоговом окне Crosstabulation Tables Results (Результаты кросстабуляции) нажмите кнопку Interaction plot of frequencies. На экране появится график взаимодействий:

График показывает,как взаимодействуют между собой частоты наблюдений из разных групп.

Простейшие задачи математической статистики Задача 1. Создать файл Arenda.sta, содержащий данные о размере и стоимости арендованных помещений. Данные находятся в таблице 1.

Таблица 1. Зависимость цены аренды от размеров помещения.

Шаг 1. Создать файл Arenda.sta ( File-New Data ->File Name:

Arenda.sta) Шаг 2. Удалите лишние 6 переменных: Vars – Delete: From variable VAR5 to Variable VAR10 – OK. Удалите лишние 2 строки: Cases – Delete.

Шаг 3. В диалоговом окне Data File Header введите заголовок ЦЕНА АРЕНДЫ. В поле Data File Information/notes введите дополнительную информацию о содержании файла и скидках.- ОК.

Шаг 4. Кликните по имени переменной VAR1. В поле Name наберите ЦЕНА. В поле Decimals: 0 (не нужны разряды после запятой). В поле Column Width: 5 (это достаточная ширина столбцов для таких данных), далее ОК.

Нажмите кнопку >> для перехода к следующей переменной и все повторите.

Для двух последних переменных оставьте ширину столбцов - 8, установленную по умолчанию.

распределенных равномерно на отрезке [0;1], запускается формулой rnd(1).

Случайные числа, распределенные равномерно на отрезке [0;2], можно сгенерировать с помощью оператора rnd(2). Оператор rnd(b-a)+a генерирует числа, распределенные равномерно на отрезке [a; b].

Выборка, распределенная по заданному закону, генерируется в файл заданием в поле Long Name соответствующего выражения:

=rnd(5) для R[0;5] =VNormal(rnd(1);2;3) для N(2;3) =VExpon(rnd(1);1/2); для E(0,5) со средним =1/ =VCauchy(rnd(1);0;1); для C(0;1) =VLognorm(rnd(1);0,5;0,5); для Lgn(0,5;0,5) =VChi2(rnd(1);8); для Такая форма задания определяется способом генерации с помощью функции, обратной (буква V) к функции распределения, и генератора случайных чисел. Здесь R – равномерное, N – нормальное, E – экспоненциальное, C –Коши, Lgn – логнормальное, 2 8 – хи-квадрат распределения.

Для генерации n случайных величин, соответствующих заданному закону распределения, необходимо выбрать один из столбцов таблицы исходных данных, состоящей из n строк. В окне его спецификаций следует ввести формулу, согласно которой вырабатываются необходимые случайные величины. Последние будут записываться в клетках данного столбца.

Шаг 1. Создайте новый файл File-New Data->File Name: Gener.sta – OK.

Шаг 2. Преобразуйте таблицу к размерам 1v*50c: Vars – Delete: From variable VAR2 to Variable VAR10 – OK. Кнопка Cases-Add (Добавление) – окно Add Cases: Number of Cases to Add: 40 – Insert after Case: 10 – OK.

Шаг 3. Генерируйте выборку: Выделите переменную VAR1 – нажмитеправую клавишу и выберите Variable specs (Спецификации переменных) – в окне Variable 1 введите Name x (например), в нижнем поле Long Name введите выражение, определяющее переменную. Ввод сделайте набором на клавиатуре или с помощью клавиши Function, выбирая в меню Category и Name требуемую функцию и вставляя клавишей Insert. Для задания закона распределения Е(5) введите: =VExpon(rnd(1);1/5) Вместо выражения 1/5 можно набрать значение параметра =0. Шаг 4. Сохраните выборку CTRL+S. Просмотрите выборку графически:

Graphs- Custom Graphs – 2DGraphs.

Задача 3. Генерировать выборки объема n=100, распределенные по а) экспоненциальному =1/7;

б) равномерному с параметрами: а=6; в=9;

с) нормальному с параметрами: =9; =1.

Указание: Привести таблицу к размерам 3v*100c; задать имена переменных:

c) VAR3 – Normal.

В поле Long Name введите выражения, определяющие переменные:

а) =VExpon(rnd(1);1/7);

в) =rnd(3)+6;

c) =VNormal(rnd(1);9;1) Задание к работе №3.

1. Выполнить примеры 1-3.

2. В табл.2 заданы варианты законов распределения. Генерировать выборку согласно выбранному варианту. Сохранить файл под именем Generat.sta. в своем каталоге.

Вычисление описательных статистик и построение простейших статистических графиков Создайте файл данных Diamz.sta 2v*100c с пременными d1 и d2 из данных приложения в модуле Basic Statistics and Tables(Основные статистики и таблицы).

Пример 1. Вычислите «быстрые» основные статистики выборки.

Шаг 1. Щелкните мышью на каком-либо значении переменной d1.

Шаг 2. Нажмите кнопку Quick Basic Stats (Быстрые основные статистики) на панели инструментов электронной таблицы.

Шаг 3. В выпадающем меню щелкните по строчке Descriptives of d1 На экране появится электронная таблица, содержащая следующие числовые характеристики переменной d1:

Valid - число случаев без пропусков Mean - выборочное среднее Confid-95% - нижняя граница доверительного интервала для среднего Confid +95% - верхняя граница доверительного интервала для среднего Sum - сумма всех выборочных значений переменной Minimum - минимальное значение переменной Maximum - максимальное значение переменной Range - размах выборки Variance - выборочная дисперсия Std.Dev. - стандартное отклонение Std.Err. - стандартная ошибка Skewness - выборочный коэффициент асиметрии St.Err.Skewness - стандартная ошибка коэффициента асиметрии Kurtosis - выборочный коэффициент эксцесса St.Err.Kurtosis - стандартная ошибка эксцесса В стартовой панели модуля выберите Descriptives Statistics - Variables:

d1- Detailed descriptive statistics.

На заголовке столбца с выборкой щелкните правой клавишей мыши BlockStats/Columns( Блоковые статистики по колонкам). Выделите необходимое или All.

Пример 2. Построить гистограмму одномерного распределения.

Шаг 1. Выберите какое-нибудь значение переменной d1.

Шаг 2. Нажмите кнопку Quick Stats Graphs (Быстрые статс - графики).

Шаг 3. В выпадающем меню выберите пункт Histogram of d1(гистограмма переменной d1) и далее пункт Regular.

Шаг 4.Сохраните график, например, graphs1.stg (CTRL+S).

Способ 2. В строке меню выберите Graphs. Далее Stats 2D Graphs Histograms - в открывшемся окне установите: имя переменной, Graph Type:

Regular, Fit Type: off (без подбора) или нужный тип, число интервалов группирования Categories: или Avto(автоматический выбор числа интервалов)OK.

Пример 3. Построить диаграмму рассеяния способом быстрого доступа к графикам.

Шаг 1. Выберите какое-нибудь значение переменной d1.

Шаг 2. Нажмите кнопку Quick Stats Graphs (Быстрые статс-графики).

Шаг 3. В выпадающем меню выберите пункт Scatterplot by…-Regular.

Шаг 4. В диалоговом окне Select one Variable щелкните по имени выбранной переменной dl.

На экране появится диаграмма рассеяния.

Пример 4. Построить диаграмму двумерного распределения.

Шаг 1. В стартовой панели модуля выберите Descriptive Statistics -ОК.

Далее нажмите кнопку Variables. В раскрывшемся окне Select All.(Выбрать все )- ОК.

Шаг 2. В окне Descriptive Statistics нажмите нижнюю кнопку в правом столбце 3D bivariate distribution gistogram (Гистограммы двумерного распределения). Далее Selecttwo variables List (Выберите два списка переменных). Выделите цветом в первом столбце переменную d1, в правом - d2 -ОК.

На экране появится трехмерная гистограмма.

Пример 5. Построить вариационный ряд.

Способ 1. Выделите требуемую переменную и выберите Quick Stats Graphs (Быстрые статс-графики)-Values/Stats of Vars(Значения и статистики) - на экране: вариационный ряд, выборочное среднее (mean) и стандартное отклонение SD.

Способ 2. Добавьте в таблицу один столбец NEW VAR, скопируйте в него через буфер обмена (кнопка Copy) одну переменную. Щелкните по кнопке Vars и выберите Rank (Ранжировать).

Способ 3. В модуле Data Management - Analisys Sort - наберите имя переменной, тип сортировки:Ascen (по возрастанию) или Desc (по убыванию) ОК.

Пример 6. Построить функцию эмпирического распределения.

В строке меню Graphs -далее - Stats 2D Graphs - Histograms – в открывшемся окне установите:, Graph Type: Regular, Cumulative Counts (Накопление частоты), Fit Type(Подбираемый тип): Exponential (*для нашего примера) или off(без подбора), Variables:, Categories(Число интервалов группирования):250 - ОК.

На экране - функция эмпирического распределения (с точностью до мелкого группирования с 250 интервалами).

Пример 7. Построить интервальный ряд (сгруппировать данные).

В строке меню: Analisys - далее -Frequency Tables задайте No of exact intervals: 10 (10 интервалов группирования) или Step size: 2,- starting at: 0.

В поле Display options отметьте Cumulative frequencies (Накопленные частоты) - ОК.

Наблюдаемую панель вывести на печать или сохранить.

Задание к работе №4.

1. Создать файл Primer.sta 1v*100c, содержащий выборку объема n=100, из индивидуальных заданий. Аналогично примерам 1-2 вычислить выборочные характеристики и построить гистограмму частот.

2. Открыть файл Gemat.sta. Аналогично примерам 3-4 построить диаграмму рассеяния и гистограмму двумерного распределения для любой пары переменных.

3. Для генерированной выборки (из файла Gener.sta) построить вариационный ряд, функцию эмпирического распределения, гистограмму частот.

4. Определить выборочные характеристики генерированной выборки.

Сравнить выборочное среднее и стандартное отклонение с соответствующими теоретическими значениями, установленными при генерации выборки.

Исследование геометрического смысла и построение таблиц модельных распределений Вероятностный калькулятор (Probability Calculator) запускается из стартовой панели модуля Basic Statistics and Tables(Основные статистики и таблицы).

Пример 1. Выяснить геометрический смысл параметров нормального распределения N(a; ).

Положите a=0, =1. В окне Probability Distribution Calculator в поле Distribution: выделите мышью строку Z(Normal), заполните поля: mean:0, sd.dev.:1, p:0,5. Поднимите флажок Fixed Scaling, далее нажмите кнопку Compute.

В поле X открытого окна появится значение.0000. Это 0.5 –квантиль нормального распределения, т.е. корень уравнения F(Z)=0.5. В поле Density Function изображается кривая распределения с заштрихованной областью.

Площадь отмеченной области равна указанному значению p=0,5. Нажмите далее Create Graph – Compute. На экране появится график плотности с отмеченным красным пунктиром квантилем. Из графика видно, что 0.5 – квантиль является модой и медианой нормального распределения. Повторяя приведенную последовательность команд для разных значений mean ( a=1; 2; -2;…), убедитесь, что значение a является точкой максимума функции плотности нормального распределения. (График плотности нормального распределения сдвигается по оси ординат при изменении среднего. При возрастании среднего графики сдвигаются вправо.) Пик плотности нормального распределения находится в точке с ординатой, равной среднему значению.

Это значение задается в поле mean (среднее).

Меняя значение поля, sd.dev.() при постоянном a и p, убедитесь, что при увеличении плотность нормального распределения рассеивается относительно a, а fmax уменьшается. При уменьшении плотность сжимается, концентрируясь возле точки максимума, fmax растет.





Похожие работы:

«Министерство образования и науки РФ Новокузнецкий институт (филиал) федерального государственного бюджетного образовательного учреждения высшего профессионального образования Кемеровский государственный университет Гуманитарный факультет Учебно-методический комплекс дисциплины Б.1.В2 Русский язык и культура речи Направление подготовки 010400.62 Прикладная математика и информатика Профиль подготовки Прикладная математика и информатика (общий профиль) Квалификация (степень) выпускника Бакалавр...»

«Центр и Фонд Холокост Томский государственный университет систем управления и радиоэлектроники Департамент общего образования Томской области ОГБУ Региональный центр развития образования Научно-просветительный Центр и Фонд Холокост МОЛОДЕЖНЫЙ КРОССКУЛЬТУРНЫЙ ФОРУМ ЭТНОКУЛЬТУРНАЯ МОЗАИКА 22-23 апреля ПРОГРАММА Томск – 2013 При реализации проекта используются средства государственной поддержки, выделенные в качестве гранта в соответствии с Распоряжением Президента Российской Федерации № 216-рп от...»

«Программа по географии. 5-9 классы ПОЯСНИТЕЛЬНАЯ ЗАПИСКА Программа по географии составлена на основе: • фундаментального ядра содержания общего образования; • требований к результатам освоения основной образовательной программы основного общего образования, представленных в федеральном государственном образовательном стандарте общего образования второго поколения; • примерной программы основного общего образования по географии как инвариантной (обязательной) части учебного курса; • программы...»

«МОСКОВСКИЙ ГУМАНИТАРНО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ ПРОГРАММА КУРСА РОССИЙСКОЕ ПРЕДПРИНИМАТЕЛЬСКОЕ ПРАВО по специальности 030501.65 Юриспруденция Учебная программа Тематический план Вопросы для подготовки к зачету Москва 2010 Чернышев В. А., Королев В. Б. Программа курса Российское предпринимательское право. – М. : МГЭИ, 2010. – 20 с. Одобрено кафедрой теории государства и права. Протокол заседания кафедры от 7 мая 2009 г. № 9. Для студентов юридического факультета Московского...»

«Межрегиональный отраслевой ресурсный центр Министерство образования и науки Российской Федерации Бюджетное образовательное учреждение Чувашской Республики среднего профессионального образования Чебоксарский электромеханический колледж Министерства образования и молодежной политики Чувашской Республики ПРОГРАММА ПРОФЕССИОНАЛЬНОГО МОДУЛЯ ПМ.05. Техническое обслуживание электронных устройств защиты и управления энергетическими объектами по специальности среднего профессионального образования...»

«МИНИСТЕРСТВО СЕЛЬСКОГО ХОЗЯЙСТВА РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Саратовский государственный аграрный университет имени Н.И. Вавилова СОГЛАСОВАНО УТВЕРЖДАЮ Заведующий кафедрой Декан факультета /Кузнецов Н.И./ _ /Дудникова Е.Б./ г. г. _ _20 _ 20 РАБОЧАЯ ПРОГРАММА ДИСЦИПЛИНЫ (МОДУЛЯ) Дисциплина ЭКОНОМИКА ПРЕДПРИЯТИЯ (АПК) Направление подготовки 080200.62 Менеджмент Производственный менеджмент...»

«Образовательная автономная некоммерческая организация высшего профессионального образования Волжский университет имени В.Н.Татищева (институт) ПРОГРАММА ВСТУПИТЕЛЬНЫХ ИСПЫТАНИЙ по дисциплине Математика для абитуриентов, поступающих на специальность и направления высшего профессионального образования Программа по математике для поступающих в ОАНО ВПО ВУиТ Вступительные испытания по математике проводятся в форме письменной работы (тестирования), с помощью которой проверяются знания учащихся,...»

«КАЗАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ УТВЕРЖДАЮ Проректор по учебной работе В.С. Бухмин ПРОГРАММА ДИСЦИПЛИНЫ КИНЕТИКА И ТЕРМОДИНАМИКА ФЕРМЕНТАТИВНЫХ РЕАКЦИЙ Цикл СД Специальность: биохимия – 012300, 020208 Принята на заседании кафедры биохимии (протокол № 1 от 09 сентября 2009 г.) Заведующий кафедрой _ (проф. Ф.К. Алимова) Утверждена учебно-методической комиссией биолого-почвенного факультета КГУ (протокол № _ от 2009 г.) Председатель комиссии (О.А. Тимофеева) Рабочая программа дисциплины...»

«1 2 Содержание 1. Паспорт программы учебной дисциплины..4 2. Структура и содержание учебной дисциплины..6 3. Условия реализации программы учебной дисциплины...13 4. Контроль и оценка результатов освоения учебной дисциплины.14 5. Компетенции обучающегося, формируемые в результате освоения дисциплины...16 3 1 Паспорт рабочей программы учебной дисциплины Теория вероятностей и математическая статистика 1.1 Область применения учебной программы Программа учебной дисциплины является частью основной...»

«Петров П.К. Информационная компетентность как основа для формирования профессиональных компетенций будущих специалистов по физической культуре и спорту // Физическая культура: воспитание, образование, тренировка. 2010. №2. С. 26ИНФОРМАЦИОННАЯ КОМПЕТЕНТНОСТЬ КАК ОСНОВА ДЛЯ ФОРМИРОВАНИЯ ПРОФЕССИОНАЛИЗМА БУДУЩИХ СПЕЦИАЛИСТОВ ПО ФИЗИЧЕСКОЙ КУЛЬТУРЕ И СПОРТУ Доктор педагогических наук, профессор П.К. Петров Удмуртский государственный университет, г. Ижевск Ключевые слова: информационная...»

«Министерство культуры Российской Федерации Федеральное государственное образовательное учреждение высшего профессионального образования МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ КУЛЬТУРЫ И ИСКУССТВ     Утверждаю: Ректор Московского государственного университета культуры и искусств Р.Г. Абдулатипов 2011 г. Номер внутривузовской регистрации       Основная образовательная программа высшего профессионального образования Специальность 070703 Звукорежиссура культурно-массовых представлений и...»

«1. ПРОГРАММА. Мероприятие Дата и время Место или адрес 05 мая 2014 г., http://www.mercury.ru/luc/form; Начало приема понедельник, http://classic-rally.ru; предварительных заявок 12:00 [email protected] 26 мая 2014 г., Окончание приема http://www.mercury.ru/luc/form; понедельник, предварительных заявок [email protected], http://classic-rally.ru 18:00 27 мая 2014 г., вторник, Публикация стартового списка http://classic-rally.ru 13: Публикация тарировочного 28 мая 2014 г., среда,...»

«Департамент молодежной политики и спорта Кемеровской области Государственное образовательное учреждение среднего профессионального образования Новокузнецкое училище (техникум) олимпийского резерва ТЕХНОЛОГИЯ 10-11 КЛАССЫ Рабочая учебная программа г. Новокузнецк, 2013 РАССМОТРЕНО Составлена в соответствии с федеральным на заседании МО преподавателей компонентом государственного 27 августа 2013 г образовательного стандарта среднего общего образования и примерной Руководитель МО преподавателей...»

«I. Анализ работы Отдела образования и молодежной политики администрации Котельниковского муниципального района за 2012-2013 учебный год. Основные целевые ориентиры деятельности Отдела образования и молодежной политики администрации Котельниковского муниципального района на 2013-2014 учебный год. Деятельность Отдела образования и молодежной политики администрации Котельниковского муниципального района Волгоградской области (далее Отдел образования) в 2012-2013 учебном году осуществлялась в...»

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ на направление 03.04.02. Физика магистерская программа: Физика плазмы; Солнечно-земная физика Иркутск 2014 Программа предназначена для абитуриентов, поступающих на направление 03.04.02 Физика магистратуры ИГУ. Программа содержит описание процедуры проведения вступительного испытания, критерии его...»

«Негосударственное образовательное учреждение высшего профессионального образования Институт государственного администрирования УТВЕРЖДАЮ Ректор НОУ ВПО Институт государственного администрирования _ А.В. Тараканов августа 2014г. ОСНОВНАЯ ПРОФЕССИОНАЛЬНАЯ ОБРАЗОВАТЕЛЬНАЯ ПРОГРАММА СРЕДНЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ по специальности 030912 – Право и организация социального обеспечения Квалификация: Юрист Уровень подготовки: базовый Форма обучения: очная Москва ОГЛАВЛЕНИЕ 1. ОБЩИЕ ПОЛОЖЕНИЯ.....»

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ СОГЛАСОВАНО УТВЕРЖДАЮ Заместитель Министра Заместитель Министра образования сельского хозяйства Российской Федерации и продовольствия Российской Федерации Н.К.Долгушкин _В.Д.Шадриков 02. февраля 2000 г. 17.03.2000 г Регистрационный номер 142 с/маг ГОСУДАРСТВЕННЫЙ ОБРАЗОВАТЕЛЬНЫЙ СТАНДАРТ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ Направление 560100 Агрохимия и агропочвоведение Степень (квалификация) - магистр сельского хозяйства Вводится с момента...»

«2 Пояснительная записка: Рабочая программа создана на основе Федерального базисного учебного плана для образовательных учреждений Российской Федерации, программе Л.Н.Боголюбова, Н. И. Городецкой и др., без изменений и добавлений. Примерная программа предусматривает выделение двух самостоятельных, связанных между собой этапов. Курс Обществознание для основной школы представляет собой один из рекомендованных Министерством образования Российской Федерации вариантов реализации новой структуры...»

«10-я Международная конференция АВИАЦИЯ И КОСМОНАВТИКА – 2011 Тезисы докладов Москва, МАИ 8 - 10 ноября 2011 г. УДК 629.7 ББК 94.3 39.52 39.62 А20 10-я Международная конференция Авиация и космонавтика – 2011. 8–10 ноября 2011 года. Москва. Тезисы докладов. – СПб.: Мастерская печати, 2011. – 328 с. В программу включены доклады, представленные в организационный комитет конференции в электронном виде. Мероприятие проводится при поддержке Российского фонда фундаментальных исследований (грант...»

«Центр проблемного анализа и государственно-управленческого проектирования при Отделении общественных наук РАН ПРОБЛЕМЫ СОВРЕМЕННОГО ГОСУДАРСТВЕННОГО УПРАВЛЕНИЯ В РОССИИ Материалы постоянно действующего научного семинара Выпуск № 8 (13) Москва Научный эксперт 2008 УДК 316.334.3(4) ББК 60.524 Научный руководитель семинара: В.И. Якунин, доктор политических наук Соруководители семинара: А.И. Соловьев, доктор политических наук, профессор; С.С. Сулакшин, доктор физико математических наук, доктор...»






 
2014 www.av.disus.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.