ГБОУ ВПО «Казанский государственный медицинский университет»
Минздравсоцразвития России
Кафедра общественного здоровья и организации здравоохранения с
курсом медицинской информатики
Вариационный ряд. Средние величины.
Расчет показателей вариационного ряда, используя мастер функций
(fх) MS Excel.
Учебно-методическое пособие для студентов лечебного факультета Казань 2011 Оглавление Цель занятия:
Студент должен уметь
Студент должен знать:
Информационный материал
Основные обозначения вариационного ряда
Виды вариационных рядов
Средняя величина
Применение средних величин
Методика расчета простой средней арифметической
Методика расчета взвешенной средней арифметической (табл. 1)............... Методика расчета среднеквадратического отклонения (см. табл. 1)............ Применение среднеквадратического отклонения
Коэффициент вариации (Сv)
Применение коэффициента вариации
РАСЧЕТ ПОКАЗАТЕЛЕЙ ВАРИАЦИОННОГО РЯДА, ИСПОЛЬЗУЯ
МАСТЕР ФУНКЦИЙ ( MS EXCELКОНТРОЛЬНЫЕ ВОПРОСЫ
ТЕСТОВЫЕ ЗАДАНИЯ:
СИТУАЦИОННЫЕ ЗАДАЧИ:
Хронология занятия 1. Формулировка и обоснования цели занятия (10 мин.);
2. Изложение основных вопросов темы (60 мин.);
3. Перерыв (20 мин.) 4. Самостоятельная работа студентов с методическим материалом - ( мин.) 5. Разбор типовых задач по изучаемой теме (20 мин.) 6. Самостоятельное решение задач (40 мин.) 7. Тестовый контроль на ПК (15 мин.) Общая продолжительность занятия – 195 минут.
Цель занятия:
ознакомить студентов методам вариационной статистики для оценки и анализа статистической совокупности при изучении общественного здоровья и деятельности медицинских учреждений.
Студент должен уметь - выявлять основную закономерность изучаемого признака путем вычисления средних величин;
- обосновывать методику применения критериев разнообразия вариационного ряда;
- давать характеристику разнообразия вариационного ряда;
- делать выводы о типичности обобщающей характеристики признака в изучаемой совокупности, используя критерии разнообразия вариационного ряда;
- рассчитывать средние величины и критерии вариационного ряда, используя мастер функций MS Excel.
Студент должен знать:
-основные понятия темы (вариационный ряд, средние величины, среднеквадратическое отклонение, коэффициент вариации, правило трех сигм, нормальное распределение Гаусса);
- методику расчета средних величин и критериев разнообразия вариационного ряда;
- методику анализа средних величин: значение среднеквадратического отклонения и коэффициента разнообразия для оценки вариабельности изучаемого признака и типичности средней величины;
- нормальное распределение вариационного ряда и его значение для оценки статистических показателей;
- область применения характеристик вариационного ряда.
Место проведения Дисплейный класс кафедры общественного здоровья и организации здравоохранения с курсом медицинской информатики Оснащение занятия Мультимедийный проектор Наглядный материал в виде мультимедийных презентаций Персональные компьютеры Информационный материал При изучении общественного здоровья (например, показателей физического развития), анализе деятельности учреждений здравоохранения за год (длительность пребывания больных на койке и др.), оценке работы медицинского персонала (нагрузка врача на приеме и др.) часто возникает необходимость получить представление о размерах изучаемого признака в совокупности для выявления его основной закономерности.
Оценить размер признака в совокупности, изменяющегося по своей величине, позволяет лишь его обобщающая характеристика, называемая средней величиной.
Для более детального анализа изучаемой совокупности по какому-либо признаку помимо средней величины необходимо также вычислить критерии разнообразия признака, которые позволяют оценить, насколько типична для данной совокупности ее обобщающая характеристика.
1. Определение вариационного ряда. Вариационный ряд - это числовые значения признака, представленные в ранговом порядке с соответствующими этим значениям частотами.
Основные обозначения вариационного ряда V — варианта, отдельное числовое выражение изучаемого признака;
р — частота ("вес") варианты, число ее повторений в вариационном n — общее число наблюдений (т.е. сумма всех частот, n = р);
Vmax и Vmin — крайние варианты, ограничивающие вариационный ряд (лимиты ряда);
А — амплитуда ряда (т.е. разность между максимальной и минимальной вариантами, А = Vmax — Vmin) Виды вариационных рядов а) простой — это ряд, в котором каждая варианта встречается по одному разу (р=1);6) взвешенный — ряд, в котором отдельные варианты встречаются неоднократно (с разной частотой).
2. Назначение вариационного ряда Вариационный ряд необходим для определения средней величины (М) и критериев разнообразия признака, подлежащего изучению (, Сv).
Средняя величина - это обобщающая характеристика размера изучаемого признака. Она позволяет одним числом количественно охарактеризовать качественно однородную совокупность.
Применение средних величин o для оценки состояния здоровья — например, параметров физического развития (средний рост, средняя масса тела, среднее значение жизненной емкости легких и др.), соматических показателей (средний уровень сахара в крови, средняя величина для оценки организации работы лечебно-профилактических и деятельности отдельных врачей и других медицинских работников (средняя длительность пребывания больного на койке, среднее число посещений на 1 ч приема в поликлинике и o для оценки состояния окружающей среды.
3. В статистике принято выделять следующие виды средних величин:
мода (Мо), медиана (Ме) и средняя арифметическая (М). Мода – величина варьирующего признака, наиболее часто встречающаяся в совокупности. В вариационном ряду это варианта, имеющая наибольшую частоту встречаемости. Обычно мода является величиной довольно близкой к средней арифметической, совпадает с ней при полной симметрии распределения. Медиана – варианта, делящая вариационный ряд на две равные половины. При нечетном числе наблюдений медианой является варианта, имеющая в вариационном ряду порядковый номер (n + 1): 2. Средняя арифметическая величина (М) – в отличие от моды и медианы опирается на все произведенные наблюдения, поэтому является важной характеристикой для всего распределения.
Методика расчета простой средней арифметической 1. Суммировать варианты: V1+V2+V3+...+Vn = V;
2. Сумму вариант разделить на общее число наблюдений: М = V / Методика расчета взвешенной средней арифметической (табл. 1) 3. Получить произведение каждой варианты на ее частоту — Vp 4. Найти сумму произведений вариант на частоты: V1p1 + V2p2+ V3p 5. Полученную сумму разделить на общее число наблюдений: М = Методика расчета среднеквадратического отклонения (см. табл. 1) среднеарифметической величины ряда (d = V — М);
7. Возвести каждое из этих отклонений в квадрат (d2);
8. Получить произведение квадрата каждого отклонения на частоту 9. Найти сумму этих отклонений: d21p1 + d22p2 + d23p3 +...+ d2npn = 10.Полученную сумму разделить на общее число наблюдений (при n Применение среднеквадратического отклонения o для суждения о колеблемости вариационных рядов и сравнительной оценки типичности (представительности) средних арифметических величин. Это необходимо в дифференциальной диагностике при определении устойчивости признаков;
для реконструкции вариационного ряда, т.е. восстановления его частотной характеристики на основе правила "трех сигм". В интервале М±3 находится 99,7% всех вариант ряда, в интервале М±2 — 95,5% и в интервале М±1 — 68,3% вариант ряда – нормальное распределение (распределение Гаусса), при этом М – Рис. 1 График плотности нормального распределения o для выявления "выскакивающих" вариант (при сопоставлении реального и реконструированного вариационных рядов);
o для определения параметров нормы и патологии с помощью o для расчета коэффициента вариации;
o для расчета средней ошибки средней арифметической величины.
Коэффициент вариации (Сv) - это процентное отношение среднеквадратического отклонения к среднеарифметической величине: Сv = / M x 100%. Коэффициент вариации — это относительная мера колеблемости вариационного ряда.
Применение коэффициента вариации - для оценки разнообразия каждого конкретного вариационного ряда и, соответственно, суждения о типичности отдельной средней (т.е. ее способности быть полноценной обобщающей характеристикой данного ряда). При Сv 20% — сильным. Сильное разнообразие ряда свидетельствует о малой представительности (типичности) соответствующей средней величины и, следовательно, о нецелесообразности ее использования в практических целях;
- для сравнительной оценки разнообразия (колеблемости) разноименных вариационных рядов и выявления более и менее стабильных признаков, что имеет значение в дифференциальной диагностике.
Таблица 1. Результаты измерения массы тела 7-летних мальчиков города Н. в 2007 г.
Условие задачи. В городе Н. в 2007 г. проведено измерение массы тела 7-летних мальчиков (данные представлены в табл. 1). По данным аналогичного исследования, выполненного в городе Н. в 1997 г., средняя масса тела 7-летних мальчиков составила 23,8 кг, ± 3,6 кг.
1. Вычислить среднюю арифметическую величину (М) и критерии разнообразия вариационного ряда (, Сv).
2. Оценить полученные результаты, сравнить их с данными предыдущего исследования, сделать соответствующие выводы.
В сгруппированном вариационном ряду центральная варианта рассчитывается как полусумма начальных вариант соседних интервалов:
Сv = / M x 100% = (4,68 / 24,0 х 100) = 19,5%.
1. Средняя масса тела 7-летних мальчиков в городе Н. в 2007 г.
составляет 24,0 кг, 2. = ±4,68 (кг).
3. Величина коэффициента вариации, равная 19,5% свидетельствует о среднем разнообразии признака (приближающемся к сильному) Таким образом, можно считать, что полученная средняя величина массы тела является достаточно представительной (типичной).
По сравнению с 1997 г., в 2007 г. отмечается более значительная вариабельность массы тела у мальчиков 7 лет (±4,68 кг против 3,6 кг).
Аналогичный вывод вытекает и из сопоставления коэффициентов вариации (Сv в 1997 году равен (3,6 / 23,8 х 100 = 15,1%).
РАСЧЕТ ПОКАЗАТЕЛЕЙ ВАРИАЦИОННОГО РЯДА,
ИСПОЛЬЗУЯ МАСТЕР ФУНКЦИЙ ( MS EXCEL
Пример 1. Рассмотрим частоту сердечных сокращений у 20 студентов и рассчитаем средние величины.Введем в ячейку А1 – А20 значения частоты сердечных сокращений (ЧСС) студентов: 48 56 54 57 47 50 59 60 67 68 70 69 74 75 53 58 86 51 (Рис.1).
Рис. 1 Ввод данных Для расчета Моды, открываем Мастер функций. Для этого определяем курсором ячейку В22, щелкаем мышью на кнопке в строке состояния и открывается окно Мастер функций. В категории выбираем Статистические, в перечне функций находим функцию Мода и нажимаем ОК (Рис. 2, 3).
Рис. 2 Выбор категории Рис. 3 Выбор функции Мода В появившемся диалоговом окне Аргументы функции определяем массив А1:А20 и нажимаем ОК (Рис. 4).
Рис. 4 Выбор массива В нашем примере Мода равна 60.
Аналогичным способом вычисляем Медиану и среднюю арифметическую (Рис. 5 - 8).
Рис. 5 Выбор функции Медиана Рис. 6 Выбор массива Рис. 7 Выбор функции Средзнач Рис. 8 Выбор массива Рис. 9 Результат анализа Итого, Медиана равна 59,5, а средняя арифметическая – 62,5 (Рис. 9).
среднеквадратичное отклонение, коэффициент вариации.
Введем данные в таблицу Excel (Рис. 10).
Рис. 10 Ввод данных для расчета В ячейки В3:В8 внесем показатели центров интервалов роста (V1) (Рис. 11).
Рис. 11 Ввод среднего значения интервала В ячейку D3 вводим формулу = В3*С3 (Рис. 12), копируем на остальные ячейки D4:D8 и полученные данные суммируем в ячейке D9. А в ячейку D10 введем формулу расчета средней арифметической = D9/C9, после чего и получаем искомую величину взвешенной средней арифметической (Рис. 13).
Рис. 12 Ввод формулы Рис. 13 Расчет средней арифметической величины Для вычисления отклонения (разности) каждой варианты от средней арифметической величины вводим формулу в ячейку Е3=В3-D10 (Рис. 14) и аналогично в остальные ячейки Е4:Е8. Находим квадрат отклонения и умножаем полученное число на число наблюдений.
Рис. 14 Ввод формулы В ячейке G9 суммируем полученные произведения квадрата отклонения на число наблюдений, делим на общее число наблюдений и находим дисперсию (D11 =G9/C9). В ячейке D12 вводим формулу расчета среднеквадратического отклонения – извлечение квадратного корня из величины дисперсии (Рис 15). Для получения квадратного корня щелкаем мышью на кнопке в строке состояния, в открывшемся окне Мастера функций выбираем категорию Математические, находим функцию Корень.
Нажимаем кнопку ОК и в открывшемся диалоговом окне указываем ячейку G9, из которой следует извлечь квадратный корень.
Рис. 15 Ввод формулы Для получения коэффициента вариации в ячейке D13 вводим формулу =D12/D10*100 (Рис. 16).
Рис. 16 Ввод формулы 4. Средний рост юношей составляет 1461,52 см;
5. = ±3,97 (см).
6. Величина коэффициента вариации, равная 2,46% свидетельствует о слабом разнообразии признака.
Таким образом, можно считать, что полученная средняя величина массы тела является достаточно представительной (типичной).
КОНТРОЛЬНЫЕ ВОПРОСЫ
Что такое вариационный ряд?Для чего используются средние величины?
По каким критериям можно оценить разнообразие признака?
В каких случаях применяют среднеквадратическое отклонение?
Каково назначение коэффициента вариации?
Как оценить величину коэффициента вариации?
Правило нормального распределения Гаусса.
ТЕСТОВЫЕ ЗАДАНИЯ:
Выберите один или несколько правильных ответов:1. Вариационный ряд — это:
а) числовые значения изучаемого признака статистической совокупности, расположенные в ранговом порядке;
б) числовые значения изучаемого признака, расположенные в ранговом порядке с соответствующими этим значениям частотами;
в) числовые значения изучаемого признака с соответствующими этим значениям частотами.
2. Средняя величина — это:
а) варианта с повторяющимся числовым значением;
б) варианта, имеющая наибольший «вес» (частоту) в вариационном ряду;
в) обобщающая числовая характеристика размера изучаемого признака.
3. Впишите недостающий вид вариационного ряда по частоте представленных в нем вариант:
б)_ 4. Средние величины применяются для оценки:
а) состояния здоровья населения;
б) организации работы и деятельности лечебно-профилактических учреждений в целом, отдельных его подразделений и врачей;
в) организации работы и деятельности всей системы здравоохранения;
г) состояния окружающей среды.
5. В каком вариационном ряду используются следующие методы расчета средней арифметической величины (подберите соответствующие ответы):
6. Укажите соответствующий алгоритм расчета для простых и взвешенных средних арифметических величин:
1) простая средняя а) перемножить каждую варианту на арифметическая величина соответствующую ей частоту (Vр);
2) взвешенная средняя б) получить сумму произведений вариант арифметическая величина на частоты (сумма Vр);
7. Характеристиками разнообразия вариационного ряда являются: а) лимиты ряда (Vmax и Vmin);
б) амплитуда ряда (А);
в) среднеквадратическое отклонение (сигма);
г) отклонение (разность) каждой варианты от среднеарифметической величины вариационного ряда (d = V — М);
д) коэффициент вариации (Сv).
8. Каково значение сигмы для анализа вариационного ряда (укажите правильные ответы):
а) характеризует внутреннее разнообразие (колеблемость) вариационного ряда;
б) применяется для сравнительной оценки типичности средних арифметических величин;
в) позволяет оценить достоверность средней величины;
г) позволяет восстановить (реконструировать) вариационный ряд по частоте на основе правила «трех сигм»;
д) применяется для выявления «выскакивающих» вариант;
е) применяется для расчета коэффициента вариации (Сv);
ж) применяется для вычисления ошибки репрезентативности средней арифметической (mM).
9. "Нормальное" распределение вариационного ряда означает:
а) распределение вариационного ряда по частоте на основе правила «трех сигм»;
б) что в пределах М±1сигма находится 68,3% вариант ряда;
в) что в пределах М±2 сигмы находятся 95,5% всех вариант;
г) что в пределах М±3 сигмы находятся 99,7% всех вариант.
СИТУАЦИОННЫЕ ЗАДАЧИ:
Задача 1 Результаты исследования здоровья студентов 2 групп по характеристике частоты сердечных сокращений (ЧСС) показали одинаковую среднюю величину (85 уд/мин). Критерий разнообразия ЧСС в одной группе — 2 удара в минуту, в другой — 4 удара в минуту.1. Определите, для какой группы средняя величина пульса при одинаковой средней частоте сердечных сокращений (М) и одинаковом числе студентов типичнее, т.е. лучше отражает состояние здоровья студентов.
2. Какой критерий разнообразия был использован для определения разнообразия признака?
Задача 2 При изучении физического развития школьников 7-го класса было установлено значительное разнообразие по росту (от 151 до 170 см). Средняя величина роста этих мальчиков равна 160 см, сигма= ±3 см.
1. Находятся ли крайние значения роста детей в пределах нормального распределения признака?
2. Какую методику (значение сигмы) Вы при этом использовали?
Задача 3 При медицинском осмотре студентов военно-медицинской академии изучены различные показатели крови, в т.ч. количество лейкоцитов колебалось в пределах 6000-9500. Среднее значение числа лейкоцитов равно 7500, сигма= ±0,5 тыс. лейкоцитов.
1. Какая величина в данном случае является «выскакивающей вариантой»?
2. Какая методика позволила определить ее?
Задача 4 В первые часы после инфаркта миокарда у больных изменяется целый ряд параметров, в том числе уровень артериального давления количество лейкоцитов и ферментов крови.
1. Какой критерий необходимо применить для оценки разнообразия признаков?
2. Обоснуйте его применение.
Задача 5 При проведении всеобщей диспансеризации детского населения в городе Н. были получены результаты изучения физического развития детей (по массе тела). При этом получили следующие данные: средняя масса тела новорожденных детей составила 2,9 кг, сигма ± 0,3 кг; средняя масса тела детей 1-го года жизни — 12 кг, сигма ± 1,0 кг.
1. Достаточно ли представленной в условии задачи информации для вывода о степени разнообразия (устойчивости) признака?
2. В какой группе более разнообразна масса тела?
Основная литература:
1. Кобринский Б.А., Зарубина Т.В. Медицинская информатика:
Учебник. М: изд. "Академия", 2009.
2. Применение методов статистического анализа для изучения общественного здоровья и здравоохранения: Учебное пособие для практических занятий / Под ред. В.З.Кучеренко. – М.:ГЭОТАР-МЕД, 2004. – 192 с.
Дополнительная литература:
1. Зайцев В.М., Лифляндский В.Г. Маринкин В.И. Прикладная медицинская статистика. – Спб: ООО «Издательства ФОЛИАНТ», 2003. – 432 с.
2. Карась С.И. Информационные основы принятия решений в медицине: Учебное пособие. – Томск: Печатная мануфактура, 2003.- 145с.
3. Чернов В.И., Родионов О.В., Есауленко И.Э. и др. Медицинская информатика: Учебное пособие.- Воронеж, 2004. – 282с.: ил.
5. Гельман В.Я. Медицинская информатика: практикум. – СПб: Питер, 2001. -480с. – (Серия "Национальная медицинская библиотека").
6. Богданов А.К., Проценко В.Д. Практические применения современных методов анализа изображений в медицине: Учебное пособие. – М.: РУДН, 2008. – 119с.: ил.
7. Санников А.Г., Егоров Д.Б., Скудных А.С., Рухлова С.А. Практикум по медицинской информатике: автоматизированное рабочее место врача и системы поддержки принятия врачебного решения. – Тюмень: П.П.Ш., 2009.
– 116с.