WWW.DISS.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
(Авторефераты, диссертации, методички, учебные программы, монографии)

 

Pages:     | 1 || 3 | 4 |   ...   | 7 |

«Электронная книга Primer of BIOSTATISTICS FOURTH EDITION Stanton A. Glantz, Ph.D. Professor of Medicine Member, Cardiovascular Reserch Institute Member, Institute for Health Policy Studies University of California, San ...»

-- [ Страница 2 ] --

ЗАДАЧИ

3.1. Если при родах шейка матки долго не раскрывается, то продолжительность родов увеличивается и может возникнуть необходимость кесарева сечения. Ч. О’Херлихи и Г. Мак-Дональд (С. O’Herlihy, H. MacDonaid. Influence of reproduction prostaglandin E2 vaginal gel on cervical ripening and labor. Obstet. Gynесоl., 54:

708—710, 1979) решили выяснить, ускоряет ли гель с простагландином Е2 раскрытие шейки матки. В исследование вошло группы рожениц. Роженицам первой группы вводили в шейку матки гель с простагландином Е2, роженицам второй группы вводили гель-плацебо. В обеих группах было по 21 роженице возраст, рост и сроки беременности были примерно одинаковы. Роды в группе, получавшей гель с простагландином Е2, длились в среднем 8,5 ч (стандартное отклонение 4,7 ч), в контрольной группе — 13,9 ч (стандартное отклонение — 4,1 ч). Можно ли утверждать, что гель с простагландином Е2 сокращал продолжительность родов?

3.2. Курение считают основным фактором, предрасполагающим к хроническим обструктивным заболеваниям легких. Что касается пассивного курения, оно таким фактором обычно не считается. Дж. Уайт и Г. Фреб усомнились в безвредности пассивного курения и исследовали проходимость дыхательных путей у некурящих, пассивных и активных курильщиков (J. White, H.

Froeb. Small-airways dysfunction in nonsmokers chronically exposed to tobacco smoke. N. Engl. J. Med., 302:720—723, 1980). Для характеристики состояния дыхательных путей взяли один из показателей функции внешнего дыхания — максимальную объемную скорость середины выдоха которую измеряли во время профилактического осмотра сотрудников Калифорнийского университета в Сан-Диего. Уменьшение этого показателя — признак нарушения проходимости дыхательных путей. Данные обследования представлены в таблице.

Некурящие работающие в помещении, работающие в Курящие выкуривающие выкуривающие среднее выкуривающие большое Можно ли считать максимальную объемную скорость середины выдоха одинаковой во всех группах?

3.3. Низкий уровень холестерина липопротеидов высокой плотности (ХЛПВП) — фактор риска ишемической болезни сердца. Некоторые исследования свидетельствуют, что физическая нагрузка может повысить уровень ХЛПВП. Дж. Хартунг и соавт. (G. Н. Hartung et al. Relation of diet to hidh-density liрoprotein cholesterol in middle-aged marathon runners, joggles, and inactive men. N. Engl. J. Med., 302:357—361, 1980) исследовали уровень ХЛПВП у бегунов-марафонцев, бегунов трусцой и лиц, не занимающихся спортом. Средний уровень ХЛПВП у лиц, не занимающихся спортом, составил 43,3 мг% (стандартное отклоСРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: ДИСПЕРСИОННЫЙ АНАЛИЗ нение 14,2 мг%), у бегунов трусцой — 58,0 мг% (стандартное отклонение 17,7 мг%) и у марафонцев — 64,8 мг% (стандартное отклонение 14,3 мг%). Будем считать, что в каждой группе было по 70 человек. Оцените статистическую значимость различий между группами.

3.4. Марихуана — наркотик, поэтому исследовать курение марихуаны на добровольцах невозможно. Исследования такого рода проводят на лабораторных животных. Г. Хубер и соавт. (G.

Huber et al. Marijuana, tetrahydrocannabinol, and pulmonary arterial antibacterial defenses. Chest, 77:403—410, 1980) изучали влияние марихуаны на антибактериальную защиту у крыс. После ингаляционного введения бактерий крыс помещали в камеру, где специальная машина окуривала их сигаретами с марихуаной. Забив крыс, исследователи извлекали легкие и подсчитывали процент погибших бактерий, который и служил показателем состояния антибактериальной защиты. Чтобы установить, что именно влияет на антибактериальную защиту — тетрагидроканнабинолы (вещества, которые обусловливают наркотическое действие марихуаны) или просто дым одну из групп окуривали сигаретами, из которых тетрагидроканнабинолы были удалены. В каждой группе было по 36 крыс. Являются ли различия статистически значимыми?

75 (тетрагидроканнабинота удалены) 73,5 0, 3.5. Стремясь отделить действие тетрагидроканнабинолов от действия дыма, Г. Хубер и соавт. изучили их действие при внуГЛАВА тривенном введении. После ингаляционного введения бактерий крысам вводили спиртовой раствор тетрагидроканнабинолов, контрольной группе вводили этиловый спирт. В обеих группах было по 36 животных. После введения тетрагидроканнабинолов доля погибших бактерий составила в среднем 51,4%, в контрольной группе — 59,4%. Стандартные ошибки среднего составили соответственно 3,2% и 3,9%. Позволяют ли эти данные утверждать, что тетрагидроканнабинолы ослабляют антибактериальную защиту?

3.6. Работа медицинской сестры сопряжена с постоянным напряжением и тяжелыми переживаниями. Груз ответственности, не уравновешенной правом принимать решения, рождает чувство усталости, раздражения и безысходности, интересная некогда работа становится ненавистным бременем. Этот синдром не совсем точно называют опустошенностью. Считается, что его развитию особенно подвержены медицинские сестры, которые работают с наиболее тяжелыми больными. Чтобы проверить это предположение, Э. Кин и соавт. (A. Keane et al. Stress in ICU and non-ICU nurses. Nurs. Res., 34:231—236, 1985) провели опрос медицинских сестер с помощью специально разработанного опросника, позволяющего оценить опустошенность в баллах. Медицинских сестер разделили на три группы в зависимости от тяжести состояния больных, с которыми они работали (1-я группа — наиболее тяжелые больные, 3-я — самые легкие). Далее каждую группу разделили на две — медицинские сестры хирургических и терапевтических отделений, таким образом, получилось 6 групп по 16 медицинских сестер в каждой. Являются ли различия между 6 группами статистически значимыми?



Стандартное отклонение 1,4,3 13,4 14,9 14,7 16,5 20, 3.7. Нитропруссид натрия и дофамин — препараты, которые широко используют при инфаркте миокарда (Инфаркт миоСРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: ДИСПЕРСИОННЫЙ АНАЛИЗ карда развивается вследствие закупорки одной из коронарных артерий. Кровь перестает поступать к тому или иному участку миокарда, который в результате отмирает от недостатка кислорода). Считается, что нитропруссид натрия облегчает работу сердца и тем самым снижает потребность миокарда в кислороде; в результате устойчивость миокарда к недостаточному кровоснабжению повышается. Дофамин препятствует падению артериального давления и увеличивает поступление крови к пораженному участку через дополнительные сосуды (так называемые коллатерали). К. Шатни и соавт. (C. Shatney et al. Effects of infusion of dopamine and nitroprusside on size of experimental myocardial infarction. Chest., 73:850—856, 1978) сравнили эффективность этих препаратов в опытах на собаках с инфарктом миокарда.

Инфаркт миокарда вызывали перевязкой коронарной артерии, после чего вводили препарат (собакам контрольной группы вводили физиологический раствор). Через 6 часов собак забивали и взвешивали пораженный участок миокарда, результат выражали в процентах от веса левого желудочка. Препарат для каждой собаки выбирали случайным образом. Исследователь, взвешивавший миокард, не знал, какой препарат вводили собаке.

Полученные данные приведены в таблице:

Группа животных Среднее среднего Дофамин Можно ли считать различия между группами статистически значимыми? (Формулы для дисперсионного анализа при неравной численности групп найдите в прил. А).

3.8. Считается, что выработка тромбоцитов (форменных элементов крови, играющих важную роль в ее свертывании) у ноГЛАВА ворожденных регулируется иначе чем у взрослых. Исследуя эту регуляцию X. Бесслер и соавт. (Н. Bessler et al. Thrombopoietic activity in newborn infants. Biol. Neonate, 49:61—65, 1986) опрeделили содержание тромбоцитов в крови взрослых и грудных детей разного возраста. Можно ли говорить о существовании различии в количестве тромбоцитов?

Дети в возрасте Сравнение двух групп: критерий В предыдущей главе мы познакомились с дисперсионным анализом. Он позволяет проверить значимость различий нескольких групп. В задачах к этой главе вы видели, что нередко нужно сравнить только две группы. В этом случае можно применить критерий Стьюдента. Сейчас мы изложим его сущность и покажем, что критерий Стьюдента — это частный случаи дисперсионного анализа.

Критерий Стьюдента чрезвычайно популярен, он используется более чем в половине медицинских публикаций*. Однако следует помнить, что этот критерий предназначен для сравнения именно двух групп, а не нескольких групп попарно. На рис. 4. представлено использование критерия Стьюдента в статьях из журнала Circulation. Критерий был использован в 54% статей, и чаще всего неверно. Мы покажем, что ошибочное использование критерия Стьюдента увеличивает вероятность «выявить» неА. R. Feinstein. Clinical biostatistics: a survey of statistical procedures in general medical journals. Clin. Phamacol. Ther., 15:97—107, 1974.

% статей Рис. 4.1. Использование статистических методов в медицинских исследованиях. Рассмотрено 142 статьи опубликованные в 56-м томе журнала Circulation (кроме обзоров, описаний случаев и работ по рентгенологии и патоморфологии). В 39% работ статистические методы не использовались вовсе, в 34% прааильно использовали критерий Стьюдента, дисперсионный анализ или другие методы. В 27% работ критерий Стьюдента использовали неправильно — для попарного сравнения нескольких групп (S. A. Glantz.

How to detect correct and prevent errors in the med call teralure. Circulation, 61:1—7, 1980).

1 – не использовали статистических методов, 2 – правильно использовали критерий Стьюдента, 3 – правильно использовали дисперсионный анализ, 4 – правильно использовали другие методы, 5 – неправильно использовали критерий Стьюдента для попарного сравнения нескольких групп.

существующие различия. Например, вместо того чтобы признать несколько методов лечения равно эффективными (или неэффективными), один из них объявляют «лучшим».

ПРИНЦИП МЕТОДА

Предположим, что мы хотим испытать диуретическое действие нового препарата. Мы набираем десять добровольцев, случайным образом разделяем их на две группы — контрольную, которая получает плацебо и экспериментальную, которая получает препарат, а затем определяем суточный диурез. Результаты предСРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА Рис. 4.2. Результаты испытаний предполагаемого диуретика. А. Диурез после приема плацебо и препарата. В обеих группах по 5 человек. Б. Теперь в обеих группах по 20 человек. Средние и стандартные отклонения остались прежними, однако доверие к результату повысилось.

ставлены на рис. 4.2А. Средний диурез в экспериментальной группе на 240 мл больше чем в контрольной. Впрочем, подобными данными мы вряд ли кого-нибудь убедим, что препарат — диуретик. Группы слишком малы.

Повторим эксперимент, увеличив число участников. Теперь в обеих группах по 20 человек. Результаты представлены на рис.

4.2Б. Средние и стандартные отклонения примерно те же, что и в эксперименте с меньшим числом участников. Кажется, однако, что результаты второго эксперимента заслуживают большего доверия. Почему?

Вспомним, что точность выборочной оценки среднего характеризуется стандартной ошибкой среднего (см. гл. 2).

где n — объем выборки, а — стандартное отклонение совокупности, из которой извлечена выборка.

С увеличением объема выборки стандартная ошибка среднего уменьшается, следовательно уменьшается и неопределенность в оценке выборочных средних. Поэтому уменьшается и неопределенность в оценке их разности. Применительно к нашему эксперименту, мы более уверены в диуретическом действии препарата. Точнее было бы сказать, мы менее уверены в справедливости гипотезы об отсутствии диуретического действия (Будь такая гипотеза верна, обе группы можно было бы считать двумя случайными выборками из нормально распределенной совокупности).

Чтобы формализовать приведенные рассуждения, рассмотрим отношение:

Стандартная ошибка разности выборочных средних Для двух случайных выборок извлеченных из одной нормально распределенной совокупности это отношение, как правило, будет близко к нулю. Чем меньше (по абсолютной величине) t, тем больше вероятность нулевой гипотезы. Чем больше t, тем больше оснований отвергнуть нулевую гипотезу и считать, что различия статистически значимы.

Для нахождения величины t нужно знать разность выборочных средних и ее ошибку. Вычислить разность выборочных средних нетрудно — просто вычтем из одного среднего другое. Сложнее найти ошибку разности. Для этого обратимся к более общей задаче нахождения стандартного отклонения разности двух чисел, случайным образом извлеченных из одной совокупности.

СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

Рис. 4.3 А. Из этой совокупности мы будем извлекать пары и вычислять разности.

Б. Разности первых 6 пар. В. Разности еще ста пар. Разброс разностей больше, чем разброс самих значений.

СТАНДАРТНОЕ ОТКЛОНЕНИЕ РАЗНОСТИ

На рис. 4.ЗА представлена совокупность из 200 членов. Среднее равно 0, стандартное отклонение 1. Выберем наугад два члена совокупности и вычислим разность. Выбранные члены помечены на рис. 4.ЗА черными кружками, полученная разность представлена таким же кружком на рис. 4.ЗБ. Извлечем еще пять пар (на рисунках они различаются штриховкой), вычислим разность для каждой пары, результат снова поместим на рис. 4.ЗБ. Похоже, что разброс разностей больше разброса исходных данных.

Извлечем наугад из исходной совокупности еще 100 пар, для каГЛАВА ждой из которых вычислим разность. Теперь все разности включая вычисленные ранее изображены на рис. 4.3В. Стандартное отклонение для полученной совокупности разностей — примерно 1,4 то есть на 40% больше чем в исходной совокупности.

Можно доказать что дисперсия разности двух случайно извлеченных значении равна сумме дисперсии совокупностей из которых они извлечены*.

В частности если извлекать значения из одной совокупноИнтересно, что дисперсия суммы двух случайно извлеченных значений тоже равна сумме дисперсий совокупностей, из которых они извлечены.

Отсюда можно вывести формулу для стандартной ошибки среднего:

Предположим, что мы случайным образом извлекли n значений из совокупности, имеющей стандартное отклонение. Выборочное среднее равно Так как дисперсия каждого из Xi равна 2, дисперсия величины nX составит а стандартное отклонение Нам нужно найти стандартное отклонение среднего X тождественно равного nX n поэтому Мы получили формулу, которой неоднократно пользовались в предыдущих главах — формулу для стандартной ошибки среднего. Заметим что, выводя, ее мы, не делали никаких допущений о совокупности, из которой извлечена выборка. В частности мы не требовали, чтобы она имела нормальное распределение.

СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

сти, то дисперсия их разности будет равна удвоенной дисперсии этой совокупности. Говоря формально если значение X извлечено из совокупности, имеющей дисперсию 2, а значение Y из совокупности имеющей дисперсию Y, то распределение всех возможных значений X – Y имеет дисперсию Почему дисперсия разностей больше дисперсии совокупности легко понять на нашем примере (см. рис. 4.3): в половине случаев члены пары лежат по разные стороны от среднего, поэтому их разность еще больше отклоняется от среднего, чем они сами.

Продолжим рассматривать рис. 4.3. Все пары извлекали из одной совокупности. Ее дисперсия равна 1. В таком случае дисперсия разностей будет Стандартное отклонение есть квадратный корень из дисперсии. Поэтому стандартное отклонение разностей равно 2, то есть больше стандартного отклонения исходной совокупности примерно на 40%, как и получилось в нашем примере.

Чтобы оценить дисперсию разности членов двух совокупностей по выборочным данным нужно в приведенной выше формуле заменить дисперсии их выборочными оценками Этой формулой можно воспользоваться и для оценки стандартной ошибки разности выборочных средних. В самом деле, стандартная ошибка выборочного среднего — это стандартное отклонение совокупности средних значений всех выборок объемом n. Поэтому Тем самым искомая стандартная ошибка разности средних Теперь мы можем вычислить отношение t.

КРИТИЧЕСКОЕ ЗНАЧЕНИЕ t

Напомним, что мы рассматриваем отношение Стандартная ошибка разности выборочных средних Воспользовавшись результатом предыдущего раздела, имеем Если ошибку среднего выразить через выборочное стандартное отклонение, получим другую запись этой формулы где n — объем выборки.

Если обе выборки извлечены из одной совокупности, то выборочные дисперсии s12 и s2 — это оценки одной и той же дисперсии 2. Поэтому их можно заменить на объединенную оценку дисперсии. Для выборок равного объема объединенная оценка дисперсии вычисляется как Значение t, полученное на основе объединенной оценки Если объем выборок одинаков, оба способа вычисления t дадут одинаковый результат. Однако если объем выборок разный, то это не так. Вскоре мы увидим, почему важно вычислять объединенную оценку дисперсии, а пока посмотрим, какие значения

СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

t мы будем получать, извлекая случайные пары выборок из одной и той же нормально распределенной совокупности.

Так как выборочные средние обычно близки к среднему по совокупности, значение t будет близко к нулю. Однако иногда мы все же будем получать большие по абсолютной величине значения t (вспомним опыты с F в предыдущей главе). Чтобы понять, какую величину t следует считать достаточно «большой», чтобы отвергнуть нулевую гипотезу, проведем мысленный эксперимент, подобный тому, что мы делали в предыдущей главе. Вернемся к испытаниям предполагаемого диуретика. Допустим, что в действительности препарат не оказывает диуретического действия.

Тогда и контрольную группу, которая получает плацебо, и экспериментальную, которая получает препарат, можно считать случайными выборками из одной совокупности. Пусть это будет совокупность из 200 человек, представленная на рис. 4.4А. Члены контрольной и экспериментальной групп различаются штриховкой. В нижней части рисунка данные по этим двум выборкам показаны так, как их видит исследователь. Взглянув на эти данные, трудно подумать, что препарат — диуретик. Полученное по этим выборкам значение t равно –0,2.

Разумеется, с не меньшим успехом можно было бы извлечь любую другую пару выборок, что и сделано на рис. 4.4Б. Как и следовало ожидать, две новые выборки отличаются как друг от друга, так и от извлеченных ранее (рис. 4.4А). Интересно, что на этот раз нам «повезло» — средний диурез довольно сильно различается. Соответствующее значение t равно –2,1. На рис. 4.4В изображена еще одна пара выборок. Они отличаются друг от друга и от выборок с рис. 4.4А и 4.4Б. Значение t для них равно 0.

Разных пар выборок можно извлечь более 1027. На рис. 4.5А приведено распределение значений t, вычисленных по 200 парам выборок. По нему уже можно судить о распределении t. Оно симметрично относительно нуля, поскольку любую из пары выборок можно счесть «первой». Как мы и предполагали, чаще всего значения t близки к нулю, значения, меньшие –2 и большие +2, встречаются редко.

На рис. 4.5Б видно, что в 10 случаях из 200 (в 5% всех случаев) t меньше –2,1 или больше +2,1. Иначе говоря, если обе выборки извлечены из одной совокупности, вероятность того, что значение Рис. 4.4.

СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

Рис. 4.4. Испытания предполагаемого диуретика. А. В действительности препарат не обладает диуретическим действием, поэтому обе группы — просто две случайные выборки из совокупности, показанной в верхней части рисунка. Члены совокупности, которым посчастливилось принять участие в исследовании, помечены штриховкой. В нижней части рисунка данные показаны такими, какими их видит исследователь. Вряд ли он решит, что препарат — диуретик: средний диурез в группах различается очень незначительно. Б. Исследователю могла бы попасться и такая пара выборок. В этом случае он наверняка бы счел препарат диуретиком. В. Еще две выборки из той же совокупности.

t лежит вне интервала от –2,1 до +2,1, составляет 5%. Продолжая извлекать пары выборок, мы увидим, что распределение принимает форму гладкой кривой, показанной на рис. 4.5В. Теперь 5% крайних значений соответствуют закрашенным областям графика левее –2,1 и правее +2,1. Итак, мы нашли, что если две выборки извлечены из одной и той же совокупности, то вероятность получить значение t, большее +2,1 или меньшее –2,1, составляет всего 5%. Следовательно, если значение t находится вне Рис. 4.5. А. Из совокупности, показанной на рис. 4.4, извлекли 200 пар случайных выборок по 10 членов в каждой, для каждой пары рассчитали значение t и нанесли его на график. Значения для t трех пар выборок с рис. 4.4 помечены черным. Большая часть значений сгруппирована вокруг нуля, однако некоторые значения по абсолютной величине превышают 1,5 и даже 2. Б. Число значений, по абсолютной величине превышающих 2,1 составляет 5%. В. Продолжая извлекать пары выборок, в конце концов мы получим гладкую кривую. 5% наибольших (по абсолютной величине) значений образуют две заштрихованные области (сумма заштрихованных площадей как раз и составляет 5% всей площади под кривой). Следовательно «большие» значения t начинаются там, где начинается заштрихованная область, то есть с t = ±2,1. Вероятность получить столь высокое значение t, извлекая случайные выборки из одной совокупности, не превышает 5%. Г. Описанный способ выбора критического значения t предопределяет возможность ошибки: в 5% случаев мы будем находить различия там, где их нет. Чтобь снизить вероятность ошибочного заключения, мы можем выбрать более высокое критическое значение. Например, чтобы площадь заштрихованной области составляла 1% от обшей площади под кривой, критическое значение должно составлять 2,878.

СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

интервала от –2,1 до +2,1, нулевую гипотезу следует отклонить, а наблюдаемые различия признать статистически значимыми.

Обратите внимание, что таким образом мы выявляем отличия экспериментальной группы от контрольной как в меньшую, так и в большую сторону — именно поэтому мы отвергаем нулевую гипотезу как при t < –2,1 так и при t > +2,1. Этот вариант критерия Стьюдента называется двусторонним, именно его обычно и используют. Существует и односторонний вариант критерия Стьюдента. Используется он гораздо реже, и в дальнейшем говоря о критерии Стьюдента, мы будем иметь в виду двусторонний вариант.

Вернемся к рис. 4.4Б. На нем показаны две случайные выборки из одной и той же совокупности при этом t = – 2,2. Как мы только что выяснили, нам следует отвергнуть нулевую гипотезу и признать исследуемый препарат диуретиком, что самой собой неверно. Хотя все расчеты были выполнены правильно, вывод ошибочен. Увы, такие случаи возможны.

Разберемся подробнее. Если значение t меньше –2,1 или больше +2,1, то при уровне значимости 0,05 мы сочтем различия статистически значимыми. Это означает, что если бы наши группы представляли собой две случайные выборки из одной и той же совокупности, то вероятность получить наблюдаемые различия (или более сильные) равна 0,05. Следовательно, ошибочный вывод о существовании различии мы будем делать в 5% случаев. Один из таких случаев и показан на рис. 4.4Б.

Чтобы застраховаться от подобных ошибок, можно принять уровень значимости не 0,05, а скажем 0,01. Тогда, как видно из рис. 4.5Г, мы должны отвергать нулевую гипотезу при t < –2, или t > +2,88. Теперь-то рис. 4.4Б нас не проведет — мы не признаем подобные различия статистически значимыми. Однако во первых ошибочные выводы о существовании различий все же не исключены просто их вероятность снизилась до 1% и во вторых вероятность не найти различии там где они есть теперь повысилась. О последней проблеме подробнее мы поговорим в гл. 6.

Критические значения t (подобно критическим значениям F они сведены в таблицу) зависят не только от уровня значимости, но и от числа степеней свободы. Если объем обеих выбоГЛАВА Таблица 4.1. Критические значения t (двусторонний вариант)

СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

Таблица 4.1. Окончание J. H. Zar. Biostatistical analysis (2 ed.). Prentice-Hall, Englewood Cliffs, N. J., 1984.

рок — n, то число степеней свободы для критерия Стьюдента равно 2(n – 1). Чем больше объем выборок, тем меньше критическое значение t. Это и понятно — чем больше выборка, тем менее выборочные оценки зависят от случайных отклонении и тем точнее представляют исходную совокупность.

ВЫБОРКИ ПРОИЗВОЛЬНОГО ОБЪЕМА

Критерий Стьюдента легко обобщается на случай, когда выборки содержат неодинаковое число членов. Напомним, что по определению где s X1 и s X 2 — стандартные ошибки средних для двух выборок.

Если объем первой выборки равен n1, а объем второй — n2, то где s1 и s2 — стандартные отклонения выборок.

Перепишем определение t, используя выборочные стандартные отклонения:

Объединенная оценка дисперсии для выборок объема n1 и n равна Это определение t для выборок произвольного объема. Число степеней свободы = n1 + n2 – 2.

Заметим, что если объемы выборок равны, то есть n1 = n2 = n, то мы получим ранее использовавшуюся формулу для t.

СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

ПРОДОЛЖЕНИЕ ПРИМЕРОВ

Применим теперь критерий Стьюдента к тем данным, которые рассматривались при изучении дисперсионного анализа. Выводы, которые мы получим, не будут отличаться от прежних, поскольку как говорилось критерий Стьюдента есть частный случай дисперсионного анализа.

Позволяет ли правильное лечение сократить срок госпитализации?

Обратимся к рис. 3.7. Средняя продолжительность госпитализации 36 больных пиелонефритом, получавших правильное (соответствующее официальным рекомендациям) лечение, составила 4,51 сут, а 36 больных, получавших неправильное лечение 6, сут. Стандартные отклонения для этих групп — соответственно 1,98 сут и 2,54 сут. Так как численность групп одна и та же, объединенная оценка дисперсии s = 1 2 (1,98 + 2,54 ) = 5,18. Подставив эту величину в выражение для t, получим Число степеней свободы = 2 (n – 1) = 2 (36 – 1) = 70. По таблице 4.1 находим, что для 1% уровня значимости критическое значение t составляет 2,648, то есть меньше чем мы получили (по абсолютной величине). Следовательно, если бы наши группы представляли собой две случайные выборки из одной совокупности, то вероятность получить наблюдаемые различия, была бы меньше 1%. Итак различия в сроках госпитализации статистически значимы.

Галотан и морфин при операциях на открытом сердце В исследовании Конахана и соавт. (рис. 3.8) минимальное АДсредн между началом анестезии и началом операции составляло в среднем: при галотановои анестезии 66,9 мм. рт. ст., при морфиноГЛАВА Таблица 4.2. Показатели гемодинамики при галотановой и морфиновой анестезии.

Наилучший сердечный Среднее артериальное давление при наилучшем сердечном Общее периферическое сосудистое сопротивление при наилучшем сердечном T. J. Conahan et al. A prospective random comparison of halothane and morphine for openheart anesthesia one year experience. Anesthesiology, 38:528—535, 1973.

вой — 73,2 мм. рт. ст. Стандартные отклонения составляли соответственно 12,2 и 14,4 мм. рт. ст. В каждой группе был больной.

Вычислим объединенную оценку дисперсии:

тогда Число степеней свободы = 2(n – 1) = 2(61 – 1) = 120. По таблице 4.1 находим, что для 5% уровня значимости критическое значение t составляет 1,980, то есть меньше, чем мы получили. Заключаем, что морфин меньше снижает артериальное давление, чем галотан.

Конахан и соавт. измеряли еще один параметр гемодинамики — минутный объем сердца (объем крови, который левый желудочек перекачивает за минуту). Поскольку этот объем зависит

СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

от размеров тела, деятельность сердца (которая и интересовала исследователей) лучше характеризуется сердечным индексом — отношением минутного объема сердца к площади поверхности тела. В группе галотана сердечный индекс определили у 9 больных (табл. 4.2), он составил в среднем 2,08 л/мин/м2 (стандартное отклонение 1,05 л/мин/м2), у 16 больных в группе морфина — 1,75 л/мин/м2 (стандартное отклонение 0,88 л/мин/м2). Является ли это различие статистически значимым?

Найдем объединенную оценку дисперсии и поэтому Число степеней свободы = 9 + 16 – 2 = 23. Критическое значение t при 5% уровне значимости составляет 2,069, что больше полученного нами. Итак, статистически значимых различий не найдено. Можно ли утверждать, что различий нет? Ответ на этот вопрос мы узнаем в гл. 6.

КРИТЕРИЙ СТЬЮДЕНТА С ТОЧКИ ЗРЕНИЯ

ДИСПЕРСИОННОГО АНАЛИЗА*

Хотя критерий Стьюдента является просто вариантом дисперсионного анализа, этот факт осознается очень немногими. Покажем, что в случае двух групп справедливо равенство F = t2.

Рассмотрим две выборки равного объема n и со средними X и X 2 и стандартными отклонениями s1 и s2.

Как вы помните, отношение F есть отношение двух оценок дисперсии. Первая, внутригрупповая оценка есть среднее выборочных дисперсий:

* Этот раздел посвящен сугубо математической стороне дела, и его можно пропустить без ущерба для понимания дальнейшего изложения.

Вторая межгрупповая оценка вычисляется по выборочным средним:

следовательно, где X — среднее двух выборочных средних:

Исключим X из формулы для s X :

Если разность возводится в квадрат все равно, что из чего вычитать (а – b)2 = (b – а)2. Поэтому Таким образом, межгрупповая оценка дисперсии F есть отношение межгрупповой оценки к внутригрупповой и равно

СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

Но величина в скобках есть не что иное, как t. Тем самым, Межгрупповое число степеней свободы в F равно числу групп минус единица, то есть 2 – 1 = 1. Внутригрупповое число степеней свободы равно произведению числа групп на число равное численности каждой группы минус единица, то есть 2(n – 1).

Но это как раз число степеней свободы в критерии Стьюдента.

Таким образом, можно сказать, что в случае сравнения двух групп критерии Стьюдента и дисперсионный анализ — варианты одного критерия. Конечно, если групп больше двух дисперсионный анализ в форме критерия Стьюдента неприменим и нужно воспользоваться общим вариантом дисперсионного анализа изложенным в гл. 3.

ОШИБКИ В ИСПОЛЬЗОВАНИИ КРИТЕРИЯ СТЬЮДЕНТА

Критерий Стьюдента предназначен для сравнения двух групп.

Однако на практике он широко (и неправильно — см. рис. 4.1) используется для оценки различии большего числа групп посредством попарного их сравнения. При этом вступает в силу эффект множественных сравнений который нам еще неоднократно встретится в разнообразных обличиях.

Рассмотрим пример. Исследуют влияние препаратов А и Б на уровень глюкозы плазмы. Исследование проводят на трех группах — получавших препарат А, получавших препарат Б и получавших плацебо В. С помощью критерия Стьюдента проводят 3 парных сравнения: группу А сравнивают с группой В, группу Б — с группой В и наконец А с Б. Получив достаточно высокое значение t в каком либо из трех сравнении сообщают что «P < 0,05». Это означает, что вероятность ошибочного заключения о существовании различии не превышает 5%. Но это неверно: вероятность ошибки значительно превышает 5%.

Разберемся подробнее. В исследовании был принят 5% уровень значимости. Значит вероятность ошибиться при сравнении групп А и В — 5%. Казалось бы все правильно. Но точно также мы ошибемся в 5% случаев при сравнении групп Б и В. И наконец при сравнении групп А и Б ошибка возможна также в 5% случаев. Следовательно, вероятность ошибиться хотя бы в одном из трех сравнении составит не 5%, а значительно больше. В общем случае эта вероятность равна где k — число сравнений.

При небольшом числе сравнений можно использовать приближенную формулу то есть вероятность ошибиться хотя бы в одном из сравнений примерно равна вероятности ошибиться в одном, помноженной на число сравнений.

Итак, в нашем исследовании вероятность ошибиться хотя бы в одном из сравнений составляет примерно 15%. При сравнении четырех групп число пар и соответственно возможных попарных сравнений равно 6. Поэтому при уровне значимости в каждом из сравнении 0,05 вероятность ошибочно обнаружить различие хотя бы в одном равна уже не 0,05, а примерно 6 0,05 = 0,30. И когда исследователь, выявив таким способом «эффективный» препарат будет говорить про 5% вероятность ошибки, на самом деле эта вероятность равна 30%.

Вернемся на минуту к нашим марсианам. Рассматривая в гл.

2 случайные выборки из населения этой планеты мы убедились, что у разных выборок из одной совокупности могут быть заметно разные средние значения и стандартные отклонения —

СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

взять хоть три случайные выборки на рис. 2.6. Представим себе что это — результаты исследования влияния гормонов человека на рост марсиан. Одной группе дали тестостерон другой — эстрадиол, а третьей — плацебо. Как известно гормоны человека не оказывают на марсиан никакого действия, поэтому три экспериментальные группы — это просто три случайные выборки из одной совокупности как мы это и знали с самого начала. Что хорошо известно нам то неизвестно исследователям. На рис. 4. результаты исследования представлены в виде принятом в медицинских публикациях. Столбиками изображены выборочные средние. Вертикальные черточки задают интервалы в плюс-минус одну стандартную ошибку среднего. Засучив рукава наши исследователи приступают к попарному сравнению групп с помощью критерия Стьюдента и получают такие значения t плацебо—тестостерон — 2,39, плацебо—эстрадиол — 0,93 и тестостерон—эстрадиол — 1,34. Так как в каждом сравнении участвуют 2 группы по 10 марсиан в каждой число степеней свободы равно 2(10 – 1) = 18. По таблице 4.1 находим, что при 5% уровне значимости критическое значение t равно 2,101. Таким образом, пришлось бы заключить что марсиане, получавшие тестостерон стали меньше ростом чем марсиане, получавшие плацебо, в то время как эстрадиол по влиянию на рост существенно не отличается от плацебо, а тестостерон от эстрадиола.

Задумайтесь над этим результатом. Что в нем не так?

Если тестостерон дал результаты не отличающиеся от эстрадиола, а эстрадиол действует неотличимо от плацебо то как тестостерон оказался отличным от плацебо? Столь странный вывод обычно не смущает исследователей, а лишь вдохновляет их на создание изощренного «Обсуждения».

Дисперсионный анализ приведенных данных дает значение F = 2,74. Число степеней свободы меж = m – 1 = 3 – 1 = 2 и вну = m (n – 1) = 3 (10 – 1) = 27. Критическое значение F для 5% уровня значимости равно 3,35, то есть превышает полученное нами.

Итак, дисперсионный анализ говорит об отсутствии различий между группами.

В заключение приведем три правила:

• Критерий Стьюдента может быть использован для проверки гипотезы о различии средних только для двух групп.

Рис. 4.6. Влияние гормонов человека на рост марсиан. Именно в таком виде результаты исследования увидели бы свет в каком-нибудь медицинском журнале. Высота столбиков соответствует средним, вертикальная черта на верхушке у каждого столбика соответствует интервалу плюс-минус одна стандартная ошибка среднего (а не стандартное отклонение).

• Если схема эксперимента предполагает большее число групп, воспользуйтесь дисперсионным анализом.

• Если критерии Стьюдента был использован для проверки различий между несколькими группами, то истинный уровень значимости можно получить, умножив уровень значимости, приводимый авторами на число возможных сравнений.

КРИТЕРИЙ СТЬЮДЕНТА ДЛЯ МНОЖЕСТВЕННЫХ

СРАВНЕНИЙ

Только что мы познакомились со злостным вредителем научных исследований — эффектом множественных сравнений. Он состоит в том, что при многократном применении критерия вероятность ошибочно найти различия там, где их нет возрастает.

Если исследуемых групп больше двух, то следует воспользоваться дисперсионным анализом. Однако дисперсионный анаСРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА лиз позволяет проверить лишь гипотезу о равенстве всех средних. Но если гипотеза не подтверждается, нельзя узнать какая именно группа отличается от других.

Это позволяют сделать методы множественного сравнения.

Все они основаны на критерии Стьюдента, но учитывают, что сравнивается более одной пары средних. Сразу поясним, когда на наш взгляд следует использовать эти методы. Наш подход состоит в том, чтобы в первую очередь с помощью дисперсионного анализа проверить нулевую гипотезу о равенстве всех средних, а уже затем если нулевая гипотеза отвергнута выделить среди них отличные от остальных, используя для этого методы множественного сравнения*. Простейший из методов множественного сравнения — введение поправки Бонферрони.

Как было показано в предыдущем разделе при трехкратном применении критерия Стьюдента, с 5% уровнем значимости, вероятность обнаружить различия там, где их нет, составляет не 5%, а почти 3 5 = 15%. Этот результат является частным случаем неравенства Бонферрони, если k раз применить критерии с уровнем значимости, то вероятность хотя бы в одном случае найти различие там, где его нет не превышает произведения k на. Неравенство Бонферрони выглядит так:

где — вероятность хотя бы один раз ошибочно выявить различия.

Можно сказать, что собственно и является истинным уровнем значимости многократно примененного критерия. Из неравенства Бонферрони следует, что если мы хотим обеспечить вероятность ошибки, то в каждом из сравнений мы должны принять уровень значимости /k — это и есть поправка Бонферрони. Например, при трехкратном сравнении уровень значимости должен быть 0,05/3 = 1,7%.

* Некоторые авторы считают этап дисперсионного анализа излишним и предлагают сразу применить методы множественного сравнения.

Этот подход изложен в В. W. Broun, Jr., M. Hollander. Statistics: a biomedical introduction. Wiley, NewYork, 1977, chap. 10. Analysis of Ksamples problems.

Поправка Бонферрони хорошо работает, если число сравнений невелико. Если оно превышает 8, метод становится слишком «строгим и даже весьма большие различия приходится признавать статистически незначимыми*. Существуют не столь жесткие методы множественного сравнения, например критерии Ньюмена-Кейлса (его мы рассмотрим в следующем разделе). Все методы множественного сравнения схожи с поправкой Бонферрони в том что, будучи модификацией критерия Стьюдента, учитывают многократность сравнений.

Один из способов смягчить строгость поправки Бонферрони состоит в том, чтобы увеличить число степеней свободы, воспользовавшись знакомой из дисперсионного анализа внутригрупповой оценкой дисперсии. Вспомним что где s2 – объединенная оценка дисперсии совокупности.

Используя в качестве такой оценки внутригрупповую дисперсию sвну (гл. 3), получим:

Если объемы выборок одинаковы то Число степеней свободы = m(n – 1). Если число групп m больше 2, то число степеней свободы при таком расчете будет * Способность критерия выявлять различия называется чувствительностью, она обсуждается в гл. 6.

СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

больше 2(n – 1) благодаря чему критическое значение t уменьшится.

Бег и менструации. Продолжение анализа В предыдущей главе мы выяснили, что различия в ежегодном числе менструальных циклов в группах спортсменок физкультурниц и в контрольной группе статистически значимы. Однако осталось неясным, отличаются ли от контрольной группы и спортсменки и физкультурницы или только спортсменки? Отличаются ли спортсменки от физкультурниц? Способа определить межгрупповые различия у нас не было. Теперь, используя критерий Стьюдента с поправкой Бонферрони, мы можем попарно сравнить все три группы.

Внутригрупповая оценка дисперсии sвну = 3,95. Число групп m = 3, численность каждой группы n = 26. Следовательно, число степеней свободы = m(n – 1) = 3(26 – 1) = 75. (Если бы мы оценивали дисперсию по двум группам, число степеней свободы было бы 2(n – 1) = 2(26 – 1) = 50). Произведем попарное сравнение трех групп.

При сравнении контрольной группы и группы физкультурниц имеем:

при сравнении контрольной группы и группы спортсменок:

и при сравнении группы физкультурниц и группы спортсменок:

Мы провели 3 сравнения, поэтому уровень значимости в кажГЛАВА дом должен быть 0,05/3, то есть примерно 0,017. По таблице 4. находим*, что при 75 степенях свободы критическое значение составляет примерно 2,45.

Таким образом, мы можем заключить, что и у спортсменок и у физкультурниц частота менструации ниже, чем в контрольной группе при этом у спортсменок и физкультурниц она не отличается.

КРИТЕРИЙ НЬЮМЕНА-КЕЙЛСА**

При большом числе сравнении поправка Бонферрони делает критерии Стьюдента излишне жестким. Более изощренный критерий Ньюмена–Кейлса дает более точную оценку вероятности ; чувствительность его выше, чем критерия Стьюдента с поправкой. Бонферрони.

Сначала нужно с помощью дисперсионного анализа проверить нулевую гипотезу о равенстве всех средних. Если она отвергается, все средние упорядочивают по возрастанию и сравнивают попарно, каждый раз вычисляя значение критерия Ньюмена–Кейлса:

Собственно говоря, значения для = 0,017 в таблице нет. В таких случаях можно либо использовать ближайшее меньшее значение (в нашем примере это 0,01) либо приблизительно рассчитать нужное критическое значение по соседним. Если нужное нам значение н находится между 1 и 2, которым соответствуют критические значения t1 и t2 то где tн — критическое значение для уровня значимости aн.

** Этот раздел важен для тех, кто использует нашу книгу как руководство по анализу данных. Его можно опустить без ущерба для пони мания остального материала.

СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

где X A и X B — сравниваемые средние, sвну — внутригрупповая дисперсия, а nA и nB численность групп.

Вычисленное значение q сравнивается с критическим значением (табл. 4.3). Критическое значение зависит от (вероятность ошибочно обнаружить различия хотя бы в одной из всех сравниваемых пар, то есть истинный уровень значимости) числа степеней свободы = N – m (где N – сумма численностей всех групп, m – число групп) и величины l, которая называется интервалом сравнения. Интервал сравнения определятся так. Если сравниваются средние стоящие соответственно на j-м и i-м месте в упорядоченном ряду, то интервал сравнения l = j – i + 1. Например, при сравнении 4-го и 1-го членов этого ряда l = 4 – 1 + 1 = 4, при сравнении 2-го и 1-го l = 2 – 1 + 1 = 2.

Результат применения критерия Ньюмена-Кейлса зависит от очередности сравнений, поэтому их следует проводить в определенном порядке. Этот порядок задается двумя правилами.

1. Если мы расположили средние от меньшего к большему (от 1 до m), то сначала нужно сравнить наибольшее с наименьшим, то есть m-оe с 1-ым, затем m-ое со 2-ым, 3-м и так далее вплоть до m – 1-го. Затем предпоследнее (m – 1-е) тем же порядком сравниваем с 1-м, 2-м и так далее до m – 2-го. Продолжаем эти «стягивающие сравнения» пока не переберем все пары. Например, в случае 4 групп порядок сравнений такой: 4 – 1, 4 – 2, 2. Перебирать все пары впрочем, приходится не всегда. Если какие-либо средние не различаются, то все средние лежащие между ними тоже не различаются. Например, если не выявлено различий между 3-м и 1-м средним, не нужно сравнивать ни 3-е со 2-м, ни 2-е с 1-м.

Бег и менструации. Продолжение анализа Воспользуемся критерием Ньюмена-Кейлса для анализа связи частоты менструации с занятиями физкультурой и спортом. Среднегодовое число менструаций в контрольной группе составило 11,5 у физкультурниц — 10,1 и у спортсменок 9,1. Упорядочим эти средние по возрастанию 9,1, 10,1, 11,5 (спортсменки физкультурницы контроль) и обозначим их X 1, X 2, X 3 соответственно.

Оценка внутригрупповой дисперсии sвну = 3,95, число степеГЛАВА Таблица 4.3А. Критические значения q для = 0, ней свободы n = 75, численность каждой группы 26 человек. Теперь мы можем воспользоваться критерием Ньюмена—Кейлса.

Сравним X 3 и X 1. Имеем:

Интервал сравнения в данном случае l = 3 – 1 + 1 = 3. По таблице 4.ЗА находим, что для уровня значимости = 0,05 числа степеней свободы = 75 и интервала сравнения l = 3 критическое

СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

Таблица 4.3Б. Критические значения q для = 0, H. I. Наrtег. Order statistics and their use in testing and estimation. Vol. 1: Tests based on range and studentized range of samples from a normal population. U.S. Government Printing Office, Washington, D.C., 1970.

значение q равно 3,385, то есть меньше чем поучилось у нас.

Следовательно, различие статистически значимо.

Теперь сравним X 3 и X 2.

Величины и те же, что и раньше, но теперь l = 3 – 2 + 1 = 2.

По таблице 4.3А находим критическое значение q = 2,822. Полученное нами значение снова превосходит критическое. Различие статистически значимо.

Величины, и l = 2 – 1 + 1 = 2 те же, что и в предыдущем сравнении, соответственно то же и критическое значение. Оно больше вычисленного, следовательно, различие статистически не значимо.

В данном случае вывод не отличается от полученного при применении критерия Стьюдента с поправкой Бонферрони.

КРИТЕРИИ ТЬЮКИ

Критерии Тьюки совпадает с критерием Ньюмена-Кейлса во всем кроме способа определения критического значения. В критерии Ньюмена-Кейлса критическое значение q зависит от интервала сравнения l. В критерии Тьюки при всех сравнениях вместо l берут число групп m, таким образом, критическое значение q все время одно и то же. Критерий Ньюмена-Кейлса был разработан как усовершенствование критерия Тьюки.

Применяя критерии Тьюки к только что рассмотренной задаче о влиянии бега на частоту менструации нужно было бы приравнять l к числу групп m = 3. Соответствующее критическое значение равно 3,385 и неизменно при всех сравнениях. В нашем примере при двух последних сравнениях критические значения по Тьюки будут больше чем по Ньюмену-Кейлсу. Однако в данном случае результат применения обоих критериев один и тот же. Разумеется, так будет не всегда. Поскольку в критерии Тьюки при всех сравнениях используется максимальное критическое значение q, различия будут выявляться реже, чем при использовании критерия Ньюмена-Кейлса.

СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

Критерий Тьюки слишком жесток и отвергает существование различий чаще, чем нужно, а критерий Ньюмена–Кейлса напротив слишком мягок. В общем, выбор критерия определяется скорее психологическим фактором, чего больше боится исследователь найти отличия там, где их нет или пропустить их там, где они есть. Автор предпочитает критерий Ньюмена–Кейлса.

МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ С КОНТРОЛЬНОЙ

ГРУППОЙ* Иногда задача заключается в том, чтобы сравнить несколько групп с единственной — контрольной. Конечно, можно было бы использовать любой из описанных методов множественного сравнения (критерий Стьюдента с поправкой Бонферрони, Ньюмена—Кейлса или Тьюки): попарно сравнить все группы, а затем отобрать те сравнения, в которых участвовала контрольная группа. Однако в любом случае (особенно при применении поправки Бонферрони) из-за большого числа лишних сравнений критическое значение окажется неоправданно высоким. Иными словами мы слишком часто будем пропускать реально существующие различия. Преодолеть эту трудность позволяют специальные методы сравнения, из которых мы разберем два. Это еще одна модификация критерия Стьюдента с поправкой Бонферрони и критерии Даннета. Как и другие методы множественного сравнения их следует применять только после того, как с помощью дисперсионного анализа отвергнута нулевая гипотеза о равенстве всех средних.

Поправка Бонферрони Применить поправку Бонферрони к сравнению нескольких групп с одной контрольной очень просто. Ход вычислений такой же что и при применении поправки Бонферрони в общем случае.

Надо только учесть, что число сравнений k составляет теперь * Этот материал важен для тех, кто использует нашу книгу как руководство для анализа данных. Во вводном курсе этот раздел можно опустить.

Таблица 4.4А. Критические значения q для = 0, Таблица 4.4Б. Критические значения q для = 0, С. W, Dunnett. New tables for multiple comparisons with a control. Biometrics, 20:482—491, 1964.

m – 1 и соответственно рассчитать уровень значимости в каждом из сравнений = /k. Применим этот метод к исследованию частоты менструаций. Сравним спортсменок и физкультурниц с контрольной группой. Число сравнений k – 2 (а не как при всех возможных сравнениях). Чтобы полная вероятность ошибочно обнаружить различия не превышала 0,05 при каждом сравнении, уровень значимости должен быть 0,05/2 = 0, (вместо 0,05/3 = 0,017). Число степеней свободы — 75; критическое значение t = 2,31 (при всех возможных сравнениях оно бы составило 2,45). Величину l для сравнения физкультурниц и спортсменок с контролем мы уже рассчитывали — 2,54 и 4, соответственно. Таким образом, и спортсменки и физкультурницы статистически значимо отличаются от контрольной группы. В данном случае вывод получился тот же, что и при применении поправки Бонферрони в общем случае. Ясно, однако, что за счет снижения критического уровня t чувствительность метода повышается. Обратите внимание, что в данном случае мы не делаем никакого заключения о различии спортсменок и физкультурниц.

Критерии Даннета Критерии Даннета — это вариант критерия Ньюмена–Кейлса для сравнения нескольких групп с одной контрольной. Он вычисляется как Число сравнении равно числу групп не считая контрольной, и существенно меньше числа сравнений в исходном критерии Ньюмена–Кейлса. Соответственно меньше и критические значения (табл. 4.4). Как и в критерии Ньюмена–Кейлса сначала средние значения для всех групп упорядочиваются только теперь — по абсолютной величине их отличия от контрольной группы. Затем контрольную группу сравнивают с остальными начиная с наиболее отличной от контрольной. Если различия с очередной группой не найдены вычисления прекращают. Параметр l постоянен и равен

СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

числу групп включая контрольную. Число степеней свободы вычисляют как в критерии Ньюмена–Кейлса: = N – m.

Применим критерий Даннета к анализу влияния бега на менструации. Сначала сравним с контрольной наиболее от нее отличную группу спортсменок:

Общее число средних равно трем, поэтому l = 3. Число степеней свободы равно 75. По таблице 4.4 находим критическое значение для уровня значимости 0,05. Оно равно 2,28. Вычисленное значение больше критического. Тем самым различие между спортсменками и контрольной группой статистически значимо и сравнения можно продолжать.

Теперь сравним с контрольной группу физкультурниц Критическое значение, q по-прежнему равно 2,28. Вычисленное значение больше. Различие между физкультурницами и контрольной группой статистически значимо.

Критерии Даннета, как вариант критерия Ньюмена-Кейлса более чувствителен, чем критерий Стьюдента с поправкой Бонферрони, особенно при большом числе групп. Если бы групп было больше, мы убедились бы, что критерии Ньюмена-Кейлса обнаруживает те различия, которые упускает критерии Стьюдента с поправкой Бонферрони завышающей критические значения t.

ЧТО ОЗНАЧАЕТ Р

Поговорим еще раз о вероятности справедливости нулевой гипотезы Р. Понимание смысла Р требует понимания логики проверки статистической гипотезы. Например, исследователь хочет узнать, влияет ли некий препарат на температуру тела. Очевидная схема эксперимента: взять две группы, одной дать препарат другой плацебо измерить температуру и вычислить для обеих групп среднюю температуру и стандартное отклонение. Средние температуры вряд ли совпадут, даже если препарат не обладает никаким действием. Поэтому естественен вопрос сколь вероятно, что наблюдаемое различие случайно?

Для ответа на этот вопрос, прежде всего, нужно выразить различия одним числом — критерием значимости. Со многими из них мы уже встречались — это критерии F, t, q и q. Значение критерия тем больше, чем больше различия. Если препарат не оказывает действия, то величина критерия будет мала, если оказывает — велика. Но что значит «мала» и что значит «велика»?

Чтобы разграничить «большие» и «малые» значения критерия, строится предположение, что препарат не оказывает влияния на температуру. Это так называемая нулевая гипотеза. Если нулевая гипотеза верна, то обе группы можно считать просто случайными выборками из одной и той же совокупности. Далее эксперимент мысленно проводится на всех возможных выборках, и для каждой пары вычисляется значение критерия. Чаше всего оно будет небольшим, но какая-то часть выборок даст весьма высокие значения. При этом мы сможем указать такое число (критическое значение), выше которого значение критерия, оказывается, скажем, в 5% случаев.

Теперь вернемся к препарату и вычислим значение критерия. Если оно превышает критическое значение, то мы можем утверждать следующее, если бы нулевая гипотеза была справедлива, то вероятность получить наблюдаемые различия была бы меньше 5%. В принятой системе обозначений это записывается как Р < 0,05. Отсюда мы заключаем, что гипотеза об отсутствии влияния препарата на температуру вряд ли справедлива, то есть различия статистически значимы (при 5% уровне значимости). Разумеется, этот вывод по сути своей носит вероятностный характер. Не исключено, что мы ошибочно признаем неэффективный препарат эффективным, то есть найдем различия там, где их нет. Однако мы можем утверждать, что вероятность подобной ошибки не превышает 5%.

Дадим определение Р.

СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

Р есть вероятность того, что значение критерия окажется не меньше критического значения при условии справедливости нулевой гипотезы об отсутствии различий между группами.

Определение можно сформулировать и по-другому.

Р есть вероятность ошибочно отвергнуть нулевую гипотезу об отсутствии различий.

Упрощая, можно сказать, что Р — это вероятность справедливости нулевой гипотезы. Часто говорят также, что Р — это вероятность ошибки. В общем, и это верно, однако несколько неточно. Дело в том, что существует два рода ошибок. Ошибка I рода — это ошибочное заключение о существовании различий, которых в действительности нет. Вероятность именно этой оценивает P. Возможна и противоположная ошибка — принять неверную нулевую гипотезу то есть не найти действительно существующее различие. Это гак называемая ошибка II рода. О вероятности этой ошибки P ничего не говорит, мы обсудим ее в гл. 6.

ЗАДАЧИ

4.1. Конахан и соавт. определили среднее артериальное давление и общее периферическое сосудистое сопротивление при операциях на открытом сердце с галотановой (9 больных) и морфиновой (16 больных) анестезией. Результаты приведены в табл.

4.2. Можно ли утверждать, что в группах галотановой и морфиновой анестезии эти гемодинамические показатели различаются статистически значимо?

4.2. Кокаин чрезвычайно вреден для сердца, он может вызвать инфаркт миокарда даже у молодых людей без атеросклероза. Кокаин сужает коронарные сосуды что приводит к уменьшению притока крови к миокарду кроме того, он ухудшает насосную функцию сердца. Нифедипин (препарат из группы антагонистов кальция) обладает способностью расширять сосуды, его применяют при ишемической болезни сердца. Ш. Хейл и соавт. (S. L.

Hale, К. J. Alker, S. H. Rezkalla et al. Nifedipine protects the heart from the acute deleterious effects of cocaine if administered before but not after cocaine. Circulation, 83:1437—1443, 1991) предположили, что нифедипин можно использовать и при поражении сердца, вызванном кокаином. Собакам вводили кокаин, а затем нифедипин либо физиологический раствор. Показателем насосной функции сердца служило среднее артериальное давление. Были получены следующие данные.

Среднее артериальное давление после приема кокаина, мм рт. ст.

Влияет ли нифедипин на среднее артериальное давление после приема кокаина?

4.3. Ш. Хейл и соавт. измеряли также диаметр коронарных артерии после приема нифедипина и плацебо. Позволяют ли приводимые ниже данные утверждать, что нифедипин влияет на диаметр коронарных артерий?

Диаметр коронарной артерии, мм

СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА

4.4. Решите задачи 3.1 и 3.5 используя критерий Стьюдента.

4.5. В задаче 3.2 приведены данные, собранные Уайтом и Фребом о проходимости дыхательных путей у некурящих работающих в помещении, где не курят у пассивных курильщиков и у курильщиков выкуривающих различное число сигарет. Дисперсионный анализ обнаружил, что приведенные данные не согласуются с гипотезой о том, что проходимость дыхательных путей во всех группах одинакова. Выделите группы с одинаковой функцией легких. Что означает полученный результат, с точки зрения первоначально поставленного вопроса влияет ли пассивное курение на функцию легких?

4.6. Используя данные задачи 3.2, оцените статистическую значимость различий некурящих работающих в помещении, где не курят со всеми остальными группами. Воспользуйтесь критерием Даннета.

4.7. Решив задачу 3.3, мы пришли к заключению, что уровень холестерина липопротеидов высокой плотности (ХЛПВП) у бегунов марафонцев бегунов трусцой и лиц, не занимающихся спортом неодинаков. Пользуясь критерием Стьюдента с поправкой Бонферрони, сравните эти группы попарно.

4.8. Используя данные задачи 3.3 и рассматривая группу не занимающихся спортом как контрольную сравните ее с остальными двумя группами. Используйте поправку Бонферрони.

4.9. Пользуясь данными задачи 3.4, найдите группы с близкими показателями антибактериальной защиты.

4.10. По данным задачи 3.7 опишите различия групп. Используйте поправку Бонферрони.

4.11. Решите снова задачу 4.10, пользуясь критерием Ньюмена—Кейлса. Сравните результат с решением задачи 4.10 и объясните различия, если они есть.

4.12. В задаче 3.6 мы установили, что существуют различия в степени опустошенности у медицинских сестер работающих с больными разной тяжести. В чем заключаются эти различия?

Анализ качественных признаков Статистические процедуры, с которыми мы познакомились в предыдущих главах, предназначены для анализа количественных признаков. Примером таких признаков служат артериальное давление диурез или продолжительность госпитализации. Единицей их измерения могут быть миллиметры ртутного столба, литры или дни. Над значениями количественных признаков можно производить арифметические действия. Можно, например, сказать, что диурез увеличился вдвое. Кроме того, их можно упорядочить, то есть расположить в порядке возрастания или убывания.

Однако очень многие признаки невозможно измерить числом. Например, можно быть либо мужчиной, либо женщиной, либо мертвым либо живым. Можно быть врачом, юристом, рабочим и так далее. Здесь мы имеем дело с качественными признаками. Эти признаки не связаны между собой никакими арифметическими соотношениями, упорядочить их также нельзя.

Единственный способ описания качественных признаков состоит в том, чтобы подсчитать число объектов, имеющих одно и

АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ

то же значение. Кроме того, можно подсчитать, какая доля от общего числа объектов приходится на то или иное значение.

Существует еще один вид признаков. Это порядковые признаки. Их можно упорядочить, но производить над ними арифметические действия нельзя. Пример порядкового признака — состояние больного тяжелое, средней тяжести, удовлетворительное. С такими признаками мы познакомимся в гл. 8 и 10, а сейчас продолжим обсуждение работы Т. Конахана и соавт. по сравнению галотановой и морфиновой анестезии начатое в гл. 3.

Мы уже знаем, что галотан и морфин по-разному влияли на артериальное давление и что это различие статистически значимо. Однако для клинициста важнее знать, наблюдалось ли различие в операционной летальности? Из 61 больного, оперированного под галотановой анестезией, умерли 8, то есть 13,1%.

При использовании морфина умерли 10 из 67, то есть 14,9%. (В гл. 4 мы для простоты считали размеры обеих групп одинаковыми, теперь используются реальные данные). Летальность при использовании галотана оказалась примерно на 1% ниже, чем при использовании морфина. Можно ли считать, что морфин опаснее галотана, или такой результат мог быть результатом случайности?

Чтобы ответить на этот вопрос нам сначала нужно найти способ оценить точность, с которой доли вычисленные по выборкам, соответствуют долям во всей совокупности. Однако прежде нам нужно понять, каким должно быть описание самой совокупности. Здесь нам пригодятся уже несколько подзабытые марсиане.

НОВОСТИ С МАРСА

В гл. 2 мы побывали на Марсе, где измерили всех его обитателей. Хотя ранее мы не говорили об этом, но больше всего нас поразило различие в пигментации марсиан, 50 марсиан были розового, а остальные 150 — зеленого цвета (рис. 5.1).

Как описать совокупность марсиан по этому признаку? Ясно, что нужно указать долю, которую составляют марсиане каждого цвета во всей совокупности марсиан. В нашем случае доля розовых марсиан pроз = 50/200 = 0,25 и зеленых pзел = 150/200 = 0,75.

Рис. 5.1. Из 200 марсиан 150 имеют зеленую окраску, остальные 50 розовые. Если наугад извлечь марсианина, то вероятность, что он окажется розовым, составляет 50/ = 0,25, то есть 25%.

Поскольку марсиане бывают только розовые и зеленые, справедливо тождество pроз + pзел = 1. Или, что то же самое, pроз = 1 – pзел.

То есть, зная pроз, мы легко определим и pзел. Таким образом, для характеристики совокупности, которая состоит из двух классов, достаточно указать численность одного из них если доля одного класса во всей совокупности равна р, то доля другого равна 1 – р. Заметим, что pроз есть еще и вероятность того, что случайно выбранный марсианин окажется розовым. Покажем, что доля р в некотором смысле аналогична среднему µ по совокупности.

Введем числовой признак X, который принимает только два значения 1 для розового и 0 для зеленого. Среднее значение признака X равно Как видим, полученное значение совпадает с долей розовых марсиан.

Повторим это рассуждение для общего случая. Пусть имеется совокупность из N членов. При этом М членов обладают каким-то качественным признаком, которого нет у остальных

АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ

N – M членов. Введем числовой признак X: у членов совокупности, обладающих качественным признаком, он будет равен 1, а у членов, не обладающих этим признаком, он будет равен 0. Тогда среднее значение X равно то есть доле членов совокупности, обладающих качественным признаком.

Используя такой подход, легко рассчитать и показатель разброса — стандартное отклонение. Не совсем ясно, однако, что понимать под разбросом, если значений признака всего два — и 1. На рис. 5.2 мы изобразили три совокупности по 200 членов в каждой. В первой из них (5.2А) все члены принадлежат к одному классу. Разброс равен нулю. На рис. 5.2Б разброс уже имеется, но он невелик. На рис. 5.2В совокупность делится на два равные класса. В этом случае разброс максимален.

Итак, найдем стандартное отклонение. По определению оно равно где для М членов совокупности значение X = 1, а для остальных N – М членов X = 0. Величина µ = р. Таким образом, или, после преобразования, Рис. 5.2. Что такое разброс данных, если значений признака всего два? Возможно, это станет яснее, если вспомнить, что разброс — это отсутствие единства. Рассмотрим три совокупности из 200 марсиан. А. Все марсиане зеленые. Царит полное единство, разброс отсутствует, = 0. Б. Среди стройных рядов зеленых марсиан появилось 10 розовых. Единство немного нарушено, появился некоторый разброс, = 0,2. В. От единства марсиан не осталось и следа: они разделились поровну на зеленых и розовых. Разброс максимален, = 0,5.

АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ

Рис. 5.3. Стандартное отклонение доли полностью определяется самой этой долей р.

Когда доля равна 0 или 1, разброс отсутствует и = 0. Когда р = 0,5, разброс максимален, = 0, Найденное стандартное отклонение полностью определяется величиной р. Этим оно принципиально отличается от стандартного отклонения для нормального распределения которое не зависит от µ. На рис. 5.3 показана зависимость от р. Она вполне согласуется с теми впечатлениями которые возникают при рассмотрении рис. 5.2: стандартное отклонение достигает максимума при р = 0,5 и равно 0 когда р равно 0 или 1.

Зная стандартное отклонение можно найти стандартную ошибку для выборочной оценки р. Посмотрим, как это делается.

ТОЧНОСТЬ ОЦЕНКИ ДОЛЕЙ

Если бы в наших руках были данные по всем членам совокупности, то не было бы никаких проблем связанных с точностью оценок. Однако нам всегда приходится довольствоваться ограниченной выборкой. Поэтому возникает вопрос, насколько точно доли в выборке соответствуют долям в совокупности. Проделаем мысленный эксперимент наподобие того, который мы провели в гл. 2, когда рассматривали насколько хорошей оценкой среднего по совокупности является выборочное среднее.

Рис. 5.4. А. Из совокупности марсиан, среди которых 150 зеленых и 50 розовых, извлекли случайную выборку из 10 особей. В выборку попало 5 зеленых и 5 розовых марсиан, на рисунке они помечены черным. Б. В таком виде данные предстанут перед исследователем, который не может наблюдать всю совокупность и вынужден судить о ней по выборке. Оценка доли розовых марсиан p = 5/10 = 0,5.

Предположим, что из всех 200 марсиан случайным образом выбрали 10. Распределение розовых и зеленых марсиан во всей совокупности неизвестное исследователям изображено в верхней части рис. 5.4. Закрашенные кружки соответствуют марсианам, попавшим в выборку. В нижней части рис. 5.4 показана информация, которой располагал бы исследователь, получивший такую выборку. Как видим в выборке розовые, и зеленые марсиане поделились поровну. Основываясь на этих данных, мы решили бы, что розовых марсиан столько же, сколько и зеленых, то есть их доля составляет 50%.

Исследователь мог бы извлечь другую выборку, например одну из представленных на рис. 5.5. Здесь выборочные доли розовых марсиан равны 30, 30, 10, и 20%. Как любая выборочная оценка, оценка доли (обозначим ее p) отражает долю р в совокупности, но отклоняется от нее в силу случайности. РассмотАНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ Рис. 5.5. Еще 4 случайные выборки из той же совокупности марсиан. Оценки доли розовых марсиан: 30, 30, 10 и 20%.

рим теперь не совокупность марсиан, а совокупность всех значений p, вычисленных по выборкам объемом 10 каждая. (Из совокупности в 200 членов можно получить более 106 таких выборок). На рис. 5.6 приведены пять значений p, вычисленных по пяти выборкам с рис. 5.4 и 5.5 и еще 20 значений полученных на других случайных выборках того же объема. Среднее этих значений составляет 30%. Это близко к истинной доле розовых марсиан — 25%. По аналогии со стандартной ошибкой среднего найдем стандартную ошибку доли. Для этого нужно охарактеризовать разброс выборочных оценок доли, то есть рассчитать Рис. 5.6. Нанесем на график оценки доли розовых марсиан, полученные по выборке с рис. 5.4 и четырем выборкам с рис. 5.5. Добавим к ним еще 20 выборочных оценок.

Получилось распределение выборочных оценок p. Стандартное отклонение совокупности средних — это стандартная ошибка доли.

стандартное отклонение совокупности p. В данном случае оно равно примерно 14%, в общем случае где p — стандартная ошибка доли, — стандартное отклонеp (1 p ), то ние, n — объем выборки. Поскольку = Заменив в приведенной формуле истинное значение доли ее оценкой p, получим оценку стандартной ошибки доли:

Из центральной предельной теоремы (см. гл. 2) вытекает, что при достаточно большом объеме выборки выборочная оценка p приближенно подчиняется нормальному распределению, имеющему среднее р и стандартное отклонение p. Однако при значениях р, близких к 0 или 1, и при малом объеме выборки это не так. При какой численности выборки можно пользоваться приведенным способом оценки? Математическая статистика утверждает, что нормальное распределение служит хорошим приАНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ ближением, если и np и n (1 p ) превосходят 5*. Напомним, что примерно 95% всех членов нормально распределенной совокупности находятся в пределах двух стандартных отклонений от среднего. Поэтому если перечисленные условия соблюдены, то с вероятностью 95% можно утверждать, что истинное значение р лежит в пределах 2 s p от p.

Вернемся на минуту к сравнению операционной летальности при галотановой и морфиновой анестезии. Напомним, что при использовании галотана летальность составила 13,1% (численность группы — 61 больной), а при использовании морфина — 14,9% (численность группы — 67 больных).

Стандартная ошибка доли для группы галотана для группы морфина Если учесть, что различие в летальности составило лишь 2%, то маловероятно, чтобы оно было обусловлено чем-нибудь, кроме случайного характера выборки.

Прежде чем двигаться дальше, перечислим те предпосылки, на которых основан излагаемый подход. Мы изучаем то, что в статистике принято называть независимыми испытаниями Бернулли. Эти испытания обладают следующими свойствами.

• Каждое отдельное испытание имеет ровно два возможных взаимно исключающих исхода.

• Вероятность данного исхода одна и та же в любом испытании.

• Все испытания независимы друг от друга.

В терминах совокупности и выборок эти свойства формулируются так.

* Если объем выборки недостаточен для использования нормального распределения, можно прибегнуть к помощи биномиального распределения.

О биномиальном распределении см. J. H. Zar. Biostatistical analysis, 2nd ed. Prentice-Hall, Englewood Cliffs, N. J., 1984.

• Каждый член совокупности принадлежит одному из двух классов.

• Доля членов совокупности принадлежащих одному классу неизменна.

• Каждый член выборки извлекается из совокупности независимо от остальных.

СРАВНЕНИЕ ДОЛЕЙ

В предыдущей главе мы рассмотрели критерий Стьюдента t. Он вычисляется на основе выборочных средних и стандартной ошибки:

Стандартная ошибка разности выборочных средних Выборочная доля p аналогична выборочному среднему. Выражение для стандартной ошибки мы уже вывели. Теперь мы можем перейти к задаче сравнения долей, то есть к проверке нулевой гипотезы о равенстве долей. Для этого используется критерий z, аналогичный критерию Стьюдента t:

Стандартная ошибка разности выборочных долей Пусть p1 и p2 — выборочные доли. Поскольку стандартная ошибка — это стандартное отклонение всех возможных значений p, полученных по выборкам заданного объема, и поскольку дисперсия разности равна сумме дисперсии стандартная ошибка разности долей равна Следовательно, Если n1 и n2 — объемы двух выборок, то

АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ

Таким образом, Итак, мы вывели формулу для критерия z. Вообще этой буквой обозначаются величины со стандартным нормальным распределением (то есть нормальным распределением со средним µ = 0 и стандартным отклонением = 1 см. табл. 6.4). С величиной z мы встретимся еще неоднократно. В данном случае нормальное распределение имеет место только при достаточно больших объемах выборок*.

Если при оценке дисперсии объединить наблюдения из обеих выборок, чувствительность критерия Стьюдента увеличится. Таким же способом можно повысить чувствительность критерия z. Действительно если справедлива нулевая гипотеза то обе выборочные доли p1 = m1/n1 и p2 = m2/n2 — это две оценки одной и той же доли p, которую мы, следовательно, можем оценить как Отсюда имеем Точнее говоря, когда значения n p и n(1 – p ) больше 5. Если хотя бы для одной выборки это условие не выполняется, то критерий z неприменим, и нужно воспользоваться точным критерием Фишера. Этот критерий мы рассмотрим чуть позже.

Подставляя полученную объединенную оценку в формулу для критерия z, имеем:

О статистически значимом различии долей можно говорить, если значение z окажется «большим». С такой же ситуацией мы имели дело, рассматривая критерии Стьюдента. Отличие состоит в том, что t подчиняется распределению Стьюдента, а z — стандартному нормальному распределению. Соответственно для нахождения «больших» значении z нужно воспользоваться стандартным нормальным распределением (рис. 2.5). Однако, поскольку при увеличении числа степеней свободы распределение Стьюдента стремится к нормальному, критические значения z можно найти в последней строке табл. 4.1. Для 5% уровня значимости оно составляет 1,96, для 1% — 2,58.

Поправка Йейтса на непрерывность Нормальное распределение служит лишь приближением для распределения z. При этом оценка P оказывается заниженной, и нулевая гипотеза будет отвергаться слишком часто. Причина состоит в том, что z принимает только дискретные значения, тогда как приближающее его нормальное распределение непрерывно. Для компенсации излишнего «оптимизма» критерия z введена поправка Йеитса называемая также поправкой на непрерывность. С учетом этой поправки выражение для z имеет следующий вид:

Поправка Йейтса слегка уменьшает значение z, уменьшая тем самым расхождение с нормальным распределением.

АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ

Галотан и морфин операционная летальность Теперь мы можем, наконец, сравнить операционную летальность при галотановой и морфиновой анестезии. Как вы помните Конахан и соавт. исходили из предположения о том, что морфин в меньшей степени угнетает кровообращение, чем галотан и потому предпочтительнее для общей анестезии. Действительно при использовании морфина артериальное давление и сердечный индекс были выше, чем при использовании галотана и различия эти статистически значимы. Однако выводы делать рано — ведь до сих пор не проанализированы различия операционной летальности, а именно этот показатель наиболее значим с практической точки зрения.

Итак, среди получавших галотан (1-я группа) умерли 8 больных из 61 (13,1%), а среди получавших морфин (2-я группа) — 10 из 67 (14,9%). Объединенная оценка доли умерших Величина n p для каждой из выборок равна соответственно n1 p1 = 61 0,141 = 8,6 и n2 p2 = 67 0,149 = 9,4. Оба значения больше 5*, поэтому можно воспользоваться критерием z. С учетом поправки Йейтса имеем:

Это очень маленькая величина. Она гораздо ниже 1,96 — криБольше 5 и n(1 – p) — нетрудно показать, что если p < 0,5, то n(1 – p) > n p.

тического значения для 5% уровня значимости. Следовательно, хотя галотан и морфин действуют на кровообращение по-разному, нет никаких оснований, говорить о различии операционной летальности.

Этот пример очень поучителен: мы убедились, сколь важно учитывать исход течения. Организм устроен сложно, действие любого препарата многообразно. Если препарат положительно влияет на сердечно-сосудистую систему, то не исключено, что он отрицательно влияет, к примеру, на органы дыхания. Какой из эффектов перевесит и как это скажется на конечном результате — предвидеть трудно. Вот почему влияние препарата на любой показатель будь то артериальное давление или сердечный индекс, нельзя считать доказательством его эффективности, пока не доказана клиническая эффективность. Иными словами следует четко различать показатели процесса — всевозможные изменения биохимических, физиологических и прочих параметров, которые, как мы полагаем, играют положительную или отрицательную роль, — и показатели результата, обладающие реальной клинической значимостью. Так, изменения артериального давления и сердечного индекса под действием галотана и морфина — это показатели процесса, которые никак не сказались на показателе результата — операционной летальности. Если бы мы довольствовались наблюдением показателей процесса, то заключили бы что морфин лучше галотана, хотя, как оказалось, выбор анестетика на летальность вообще не влияет.

Читая медицинские публикации или слушая аргументы сторонника того или иного метода лечения, следует, прежде всего, уяснить, о каких показателях идет речь — процесса или результата. Продемонстрировать воздействие некоторого фактора на процесс существенно легче, чем выяснить влияет ли он на результат. Регистрация показателей процесса обычно проста и не занимает много времени. Напротив, выяснение результата, как правило, требует кропотливой длительной работы и нередко связано с субъективными проблемами измерений, особенно если речь идет о качестве жизни. И все же, решая необходим ли предлагаемый метод лечения, нужно удостовериться, что, он положительно влияет именно на показатели результата. Поверьте, больного и его семью, прежде всего, волнует результат, а не процесс.

АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ

Тромбоз шунта у больных на гемодиализе Гемодиализ позволяет сохранить жизнь людям, страдающим хронической почечной недостаточностью. При гемодиализе кровь больного пропускают через искусственную почку — аппарат, удаляющий из крови продукты обмена веществ. Искусственная почка подсоединяется к артерии и вене больного: кровь из артерии поступает в аппарат и оттуда, уже очищенная — в вену. Так как гемодиализ проводится регулярно, больному устанавливают артериовенозный шунт. В артерию и вену на предплечье вводят тефлоновые трубки; их концы выводят наружу и соединяют друг с другом. При очередной процедуре гемодиализа трубки разъединяют между собой и присоединяют к аппарату. После диализа трубки вновь соединяют, и кровь течет по шунту из артерии в вену. Завихрения тока крови в местах соединения трубок и сосудов приводят к тому, что шунт часто тромбируется. Тромбы приходится регулярно удалять, а в тяжелых случаях даже менять шунт. Руководствуясь тем, что аспирин препятствует образованию тромбов, Г. Хартер и соавт.* решили проверить, нельзя ли снизить риск тромбоза назначением небольших доз аспирина (160 мг/сут). Было проведено контролируемое испытание. Все больные, согласившиеся на участие в испытании и не имевшие противопоказании к аспирину, были случайным образом разделены на две группы: 1-я получала плацебо, 2-я — аспирин. Ни врач, дававший больному препарат, ни больной не знали, был это аспирин или плацебо. Такой способ проведения испытания (он называется двойным слепым) исключает «подсуживание» со стороны врача или больного и, хотя технически сложен, дает наиболее надежные результаты. Исследование проводилось до тех пор, пока общее число больных с тромбозом шунта не достигло 24. Группы практически не различались по возрасту, полу и продолжительности лечения гемодиализом.

B 1-й группе тромбоз шунта произошел у 18 из 25 больных, во 2-й — у 6 из 19. Можно ли говорить о статистически значимом * Н. R. Harter, J. W. Burch, P. W. Majerus, N. Stanford, J. A. Delmez, С. В.

Anderson, С. A. Weerts. Prevention of thrombosis in patients in hemodialysis by low-dose aspirin. N. Engl. J. Med., 301:577—579, 1979.

различии доли больных с тромбозом, а тем самым об эффективности аспирина?

Прежде всего, оценим долю больных с тромбозами в каждой из групп:

Проверим можно ли применять критерии z: рассчитаем величины n p и n(1 – p) в каждой из групп:

n1 p1= 18, n1(1 – p1) = n2 p2 = 6, n2(1 – p2) = 13.

Как видим, все величины больше 5, поэтому критерии z применить можно.

Объединенная оценка доли больных с тромбозом Наконец вычислим значение z По табл. 4.1 находим, что для 2% уровня значимости критическое значение z составляет 2,3263, то есть меньше, чем мы получили. А это значит что снижение риска тромбоза шунта при приеме аспирина статистически значимо. Иными словами если бы группы представляли собой две случайные выборки из одной

АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ

совокупности, то вероятность получить наблюдаемые (или большие) различия не превышала бы 2%.

ТАБЛИЦЫ СОПРЯЖЕННОСТИ: КРИТЕРИЙ

Рассмотренный выше метод хорошо работает, если качественный признак, который нас интересует, принимает два значения (тромбоз есть — нет, марсианин зеленый — розовый). Более того, поскольку метод является прямым аналогом критерия Стьюдента, число сравниваемых выборок также должно быть равно двум.

Понятно, что и число значений признака и число выборок может оказаться большим двух. Для анализа таких случаев нужен иной метод аналогичный дисперсионному анализу. С виду этот метод, который мы сейчас изложим, сильно отличается от критерия z, но на самом деле между ними много общего.

Чтоб не ходить далеко за примером начнем с только что разобранной задачи о тромбозе шунтов. Теперь мы будем рассматривать не долю, а число больных с тромбозом. Занесем результаты испытания в таблицу (табл. 5.1). Для каждой из групп укажем число больных с тромбозом и без тромбоза. У нас два признака:

препарат (аспирин—плацебо) и тромбоз (есть—нет); в таблице указаны все их возможные сочетания, поэтому такая таблица называется таблицей сопряженности. В данном случае размер таблицы 22.

Посмотрим на клетки расположенные, на диагонали идущей из верхнего левого в нижний правый угол. Числа в них заметно больше чисел в других клетках таблицы. Это наводит на мысль о связи между приемом аспирина и риском тромбоза.

Теперь взглянем на табл. 5.2. Это таблица ожидаемых чисел, которые мы получили бы, если бы аспирин не влиял на риск тромбоза. Как рассчитать ожидаемые числа, мы разберем чуть ниже, а пока обратим внимание на внешние особенности таблицы. Кроме немного пугающих дробных чисел в клетках можно заметить еще одно отличие от табл. 5.1 — это суммарные данные по группам в правом столбце и по тромбозам — в нижней строке. В правом нижнем углу — общее число больных в испытании. ОбГЛАВА Таблица 5.1. Тромбозы шунта при приеме плацебо и аспирина ратите внимание, что, хотя числа в клетках на рис. 5.1 и 5.2 разные, суммы по строкам и по столбцам одинаковы.

Как же рассчитать ожидаемые числа? Плацебо получали человек, аспирин — 19. Тромбоз шунта произошел у 24 из обследованных, то есть в 54,55% случаев не произошел — у из 44, то есть в 45,45% случаев. Примем нулевую гипотезу о том, что аспирин не влияет на риск тромбоза. Тогда тромбоз должен с равной частотой 54,55% наблюдаться в группах плацебо и аспирина. Рассчитав, сколько составляет 54,55% от 25 и 19, получим соответственно 13,64 и 10,36. Это и есть ожидаемые числа больных с тромбозом в группах плацебо и аспирина.

Таким же образом можно получить ожидаемые числа больных без тромбоза в группе плацебо — 45,45% от 25, то есть 11,36 в группе аспирина — 45,45% от 19, то есть 8,64. Обратите внимание, что ожидаемые числа рассчитываются до второго знака после запятой — такая точность понадобится при дальнейших вычислениях.

Сравним табл. 5.1 и 5.2. Числа в клетках довольно сильно различаются. Следовательно, реальная картина отличается от той, которая наблюдалась бы, если бы аспирин не оказывал влияния на риск тромбоза. Теперь осталось построить критерий, который бы характеризовал эти различия одним числом, и затем найти его критическое значение, — то есть поступить, так как в случае критериев F, t или z.

Однако сначала вспомним еще один уже знакомый нам приТаблица 5.2. Тромбозы шунта при приеме плацебо и аспирина:

ожидаемые числа

АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ

Таблица 5.3. Операционная летальность при галотановой и морфиновой анестезии мер — работу Конахана по сравнению галотана и морфина, а именно ту часть, где сравнивалась операционная летальность.

Соответствующие данные приведены в табл. 5.3. Форма таблицы такая же, что и табл. 5.1. В свою очередь табл. 5.4 подобно табл. 5.2 содержит ожидаемые числа, то есть числа, вычисленные исходя из предположения, что летальность не зависит от анестетика. Из всех 128 оперированных в живых осталось 110, то есть 85,94%. Если бы выбор анестезии не оказывал влияния на летальность то в обеих группах доля выживших была бы такой же и число выживших составило бы в группе галотана — 85,94% от 61, то есть 52,42 в группе морфина — 85,94% от 67, то есть 57,58. Таким же образом можно получить и ожидаемые числа умерших. Сравним таблицы 5.3 и 5.4. В отличие от предыдущего примера, различия между ожидаемыми и наблюдаемыми значениями очень малы. Как мы выяснили раньше, различий в летальности нет. Похоже мы на правильном пути.

Критерии 2 для таблицы Критерий 2 (читается «хи-квадрат») не требует никаких предположений относительно параметров совокупности, из которой извлечены выборки, — это первый из непараметрических критериев, с которым мы знакомимся. Займемся его построением.

Во-первых, как и всегда, критерий должен давать одно число, Таблица. 5.4. Операционная летальность при галотановой и морфиновой анестезии: ожидаемые числа которое служило бы мерой отличия наблюдаемых данных от ожидаемых, то есть в данном случае различия между таблицей наблюдаемых и ожидаемых чисел. Во-вторых критерий должен учитывать, что различие, скажем, в одного больного имеет большее значение при малом ожидаемом числе, чем при большом.

Определим критерий 2 следующим образом:

где О — наблюдаемое число в клетке таблицы сопряженности, Е — ожидаемое число в той же клетке. Суммирование проводится по всем клеткам таблицы. Как видно из формулы, чем больше разница наблюдаемого и ожидаемого числа, тем больший вклад вносит клетка в величину 2. При этом клетки с малым ожидаемым числом вносят больший вклад. Таким образом, критерий удовлетворяет обоим требованиям — во-первых, измеряет различия и, во-вторых, учитывает их величину относительно ожидаемых чисел.

Применим критерии 2 к данным по тромбозам шунта. В табл.

5.1 приведены наблюдаемые числа, а в табл. 5.2 — ожидаемые.

Много это или мало? Испытаем наш новый критерий на данных по галотановой и морфиновой анестезии (табл. 5.3 и 5.4):

Разница найденных значений 2 довольно велика: 7,10 в первом случае и 0,09 во втором, что соответствует тем впечатлениям, которые мы получили, сравнивая табл. 5.1 с 5.2 и 5.3 с 5.4. В Рис. 5.7. Распределение 2 с 1 степенью свободы. Заштрихованная зона — это 5% наибольших значений.

ло и значение z, полученное по тем же данным. Можно показать, что для таблиц сопряженности размером 22 выполняется равенство 2 = z2.

Критическое значение 2 можно найти хорошо знакомым нам способом. На рис. 5.7 показано распределение возможных значений 2 для таблиц сопряженности размером 22 для случая, когда между изучаемыми признаками нет никакой связи.

Величина 2 превышает 3,84 только в 5% случаев. Таким образом, 3,84 — критическое значение для 5% уровня значимости.

В примере с тромбозом шунта мы получили значение 7,10, поэтому мы отклоняем гипотезу об отсутствии связи между приемом аспирина и образованием тромбов. Напротив, данные из табл. 5.3 хорошо согласуются с гипотезой об одинаковом влиянии галотана и морфина на послеоперационный уровень смертности.

Разумеется, как и все критерии значимости, 2 даёт вероятностную оценку истинности той или иной гипотезы. На самом деле аспирин может и не оказывать влияния на риск тромбоза.

На самом деле галотан и морфин могут по-разному влиять на операционную летальность. Но, как показал критерий, и то и другое маловероятно.

Применение критерия 2 правомерно, если ожидаемое число в любой из клеток больше или равно 5*. Это условие аналогично условию применимости критерия z.

Критическое значение 2 зависит от размеров таблицы сопряженности, то есть от числа сравниваемых методов лечения (строк таблицы) и числа возможных исходов (столбцов таблицы). Размер таблицы выражается числом степеней свободы :

где r — число строк, а с — число столбцов. Для таблиц размером 22 имеем = (2 – l)(2 – l) = l. Критические значения 2 для разных приведены в табл. 5.7.

Приведенная ранее формула для 2 в случае таблицы 22 (то есть при 1 степени свободы) дает несколько завышенные значения (сходная ситуация была с критерием z). Это вызвано тем, что теоретическое распределение 2 непрерывно, тогда как набор вычисленных значений 2 дискретен. На практике это приведет к тому, что нулевая гипотеза будет отвергаться слишком часто. Чтобы компенсировать этот эффект, в формулу вводят поправку Йеитса:

Заметим, поправка Йеитса применяется только при = 1, то есть для таблиц 22.

Применим поправку Йеитса к изучению связи между приемом аспирина и тромбозами шунта (табл. 5.1 и 5.2):

* В противном случае мы вынуждены использовать точный критерий Фишера.

АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ

Как вы помните, без поправки Йеитса значение 2 равнялось 7,10. Исправленное значение 2 оказалось меньше 6,635 — критического значения для 1% уровня значимости, но по-прежнему превосходит 5,024 — критическое значение для 2,5% уровня значимости.

Критерий 2 для произвольной таблицы сопряженности Теперь рассмотрим случай, когда таблица сопряженности имеет число строк или столбцов, большее двух. Обратите внимание, что критерий z в таких случаях неприменим.

В гл. 3 мы показали, что занятия бегом уменьшают число менструаций*. Побуждают ли эти изменения обращаться к врачу? В табл. 5.5 приведены результаты опроса участниц исследования. Подтверждают ли эти данные гипотезу о том, что занятия бегом не влияют на вероятность обращения к врачу по поводу нерегулярности менструации?

Из 165 обследованных женщин 69 (то есть 42%) обратились к врачу, остальные 96 (то есть 58%) к врачу не обращались. Если Таблица 5.5. Частота обращения к врачу по поводу менструаций * При этом мы для простоты вычислений размеры всех трех групп — контрольной, физкультурниц и спортсменок — полагали одинаковыми. Теперь мы воспользуемся настоящими данными.

Таблица 5.6. Частота обращения к врачу по поводу менструаций:

ожидаемые числа занятия бегом не влияют на вероятность обращения к врачу, то в каждой из групп к врачу должно было обратиться 42% женщин. В табл. 5.6 приведены соответствующие ожидаемые значения. Сильно ли отличаются от них реальные данные?

Для ответа на этот вопрос вычислим 2:

Число строк таблицы сопряженности равно трем, столбцов — двум, поэтому число степеней свободы = (3 – 1)(2 – 1) = 2. Если гипотеза об отсутствии межгрупповых различий верна, то, как видно из табл. 5.7 значение 2 превзойдет 9,21 не более чем в 1% случаев. Полученное значение больше. Тем самым, при уровне значимости 0,01 можно отклонить гипотезу об отсутствии связи между бегом и обращениями к врачу по поводу менструации. Однако, выяснив, что связь существует мы, тем не менее, не сможем указать какая (какие) именно группы отличаются от остальных.

Итак, мы познакомились с критерием 2. Вот порядок его применения.

• Постройте по имеющимся данным таблицу сопряженности.

• Подсчитайте число объектов в каждой строке и в каждом столбце и найдите, какую долю от общего числа объектов составляют эти величины.

• Зная эти доли, подсчитайте с точностью до двух знаков после запятой ожидаемые числа — количество объектов, которое

class='zagtext'>АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ

попало бы в каждую клетку таблицы, если бы связь между строками и столбцами отсутствовала • Найдите величину, характеризующую различия наблюдаемых и ожидаемых значений. Если таблица сопряженности имеет размер 22, примените поправку Йеитса • Вычислите число степеней свободы, выберите уровень значимости и по табл. 5.7, определите критическое значение 2.

Сравните его с полученным для вашей таблицы.

Как вы помните, для таблиц сопряженности размером критерий 2 применим только в случае, когда все ожидаемые числа больше 5. Как обстоит дело с таблицами большего размера? В этом случае критерии 2 применим, если все ожидаемые числа не меньше 1 и доля клеток с ожидаемыми числами меньше 5 не превышает 20%. При невыполнении этих условии критерии 2 может дать ложные результаты. В таком случае можно собрать дополнительные данные, однако это не всегда осуществимо. Есть и более простой путь — объединить несколько строк или столбцов. Ниже мы покажем, как это сделать.

Преобразование таблиц сопряженности В предыдущем разделе мы установили существование связи между занятием бегом и обращениями к врачу по поводу менструаций или, что, то же самое, существование различий между группами по частоте обращения к врачу. Однако мы не могли определить, какие именно группы отличаются друг от друга, а какие нет. С похожей ситуацией мы сталкивались в дисперсионном анализе. При сравнении нескольких групп дисперсионный анализ позволяет обнаружить сам факт существования различий, но не указывает выделяющиеся группы. Последнее позволяют сделать процедуры множественного сравнения, о которых мы говорили в гл. 4. Нечто похожее можно проделать и с таблицами сопряженности.

Глядя на табл. 5.5, можно предположить, что физкультурницы и спортсменки обращались к врачу чаще, чем женщины из контрольной группы. Различие между физкультурницами и спортсменками кажется незначительным.



Pages:     | 1 || 3 | 4 |   ...   | 7 |


Похожие работы:

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Ярославский государственный университет им. П.Г. Демидова Экономический факультет УТВЕРЖДАЮ Проректор по развитию образования _Е.В.Сапир _2012 г. Рабочая программа дисциплины послевузовского профессионального образования (аспирантура) Актуальные проблемы статистики по специальности научных работников 08.00.12 Бухгалтерский учет, статистика 2 Ярославль 2012 1. Цель освоения дисциплины. Целями освоения дисциплины Актуальные проблемы статистики...»

«Дорогие коллеги и друзья! Как обычно, начало Нового года совпадает с очередным форумом Кардиология 2003. На этот раз на ша встреча юбилейная. Пятый год в чудесном Доме художников на Крымском валу в Москве собираются кардиологи со всех уголков России и стран СНГ.В этом году научная про грамма форума посвящена клиниче ским рекомендациям по ведению кардиологических больных. К насто ящему времени накоплен большой материал клинических исследова ний, проведенных у нас в стране и за рубежом, что...»

«Приложение 5А: Рабочая программа специальной дисциплины Историческое введение в русистику ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ ПЯТИГОРСКИЙ ГОСУДАРСТВЕННЫЙ ЛИНГВИСТИЧЕСКИЙ УНИВЕРСИТЕТ Утверждаю Проректор по научной работе и развитию интеллектуального потенциала университета профессор З.А. Заврумов _2012 г. Аспирантура по специальности 10.02.01 Русский язык отрасль наук и: 10.00.00 Филологические науки Кафедра русской словесности...»

«Макет региональной целевой программы Формирование здорового образа жизни населения и комплексная профилактика неинфекционных заболеваний в субъекте Российской Федерации Бойцов С.А. Государственный научно-исследовательский центр профилактической медицины, Москва Три стратегии профилактики неинфекционных заболеваний 1. Популяционная стратегия 2. Стратегия высокого риска (выявление в популяции лиц с высоким риском ССЗ и проведение у них активных профилактических мероприятий, в том числе с помощью...»

«УТВЕРЖДАЮ Ректор ГАОУДПО (пк) СРККРИРО _Т.Г. Навазова 20 февраля 2013г. ПОЛОЖЕНИЕ о размещении методических материалов педагогов Республики Коми на сайте ГАОУДПО(пк)СРК КРИРО (проект Электронная публикация) I. Общие положения 1.1. Настоящее положение определяет цели, задачи и порядок круглогодичного размещения методических и дидактических материалов педагогов в Электронной публикации на сайте ГАОУДПО(пк)СРК КРИРО, далее - Институт. 1.2. Целями размещения методических и дидактических...»

«Министерство образования и науки Российской Федерации Беловский институт (филиал) федерального государственного бюджетного образовательного учреждения высшего профессионального образования Кемеровский государственный университет кафедра общественных наук Рабочая программа дисциплины Физическое воспитание Направление подготовки 030900.62 Юриспруденция Квалификация (степень) выпускника Бакалавр Форма обучения Заочная (5 лет, сокращенная) Белово Print to PDF without this message by purchasing...»

«1 ФГБОУ ВПО УЛЬЯНОВСКАЯ ГОСУДАРСТВЕННАЯ СЕЛЬСКОХОЗЯЙСТВЕННАЯ АКАДЕМИЯ ИМ. П.А. СТОЛЫПИНА РАБОЧАЯ ПРОГРАММА по производственной практике ПМ 02 Участие в диагностике и лечении заболеваний сельскохозяйственных животных МДК.02.01 Методики диагностики и лечения заболеваний сельскохозяйственных животных Тема 2.1 Патологическая физиология Тема 2.2 Патологическая анатомия Тема 2.3 Внутренние незаразные болезни Тема 2.4 Эпизоотология Тема 2.5 Паразитология и инвазионные болезни Тема 2.6 Ветеринарная...»

«14.00.02 Анатомия человека ПРОГРАММА-МИНИМУМ кандидатского экзамена по специальности 14.00.02 Анатомия человека по медицинским и биологическим наукам Введение Настоящая программа включает перечень вопросов, которые должны быть рассмотрены при углубленном изучении анатомии человека, составляющих его органов, систем и аппаратов. Программа соответствует современному уровню развития анатомии и смежных научных дисциплин (гистологии, эмбриологии, антропологии и др.). Программа составлена по...»

«Пояснительная записка Рабочая программа по курсу Изобразительное искусство разработана на основе ФГОС НОО второго поколения по изобразительному искусству и авторской программы В. М. Кузина Изобразительное искусство с учетом межпредметных и внутрипредметных связей, логики учебного процесса, задачи формирования у младших школьников умения учиться. Программа направлена на достижение планируемых результатов, реализацию программы формирования универсальных учебных действий. Исходными документами для...»

«Тайпер Версия 2.9 11/2010 Программа Тайпер предназначена для набора архивных описей, а также карточек каталога, составляемых на массив дел и документов, передаваемых на государственное хранение в Архив РАН или уже хранящихся в Архиве. В первую очередь программа рекомендована архивным учреждениям, которые являются источниками комплектования Архива РАН, потому что заключает в себе возможность передавать в Архив не только традиционный (отпечатанный на принтере) комплект архивных описей, но и файлы...»

«Полное наименование учебного предмета: ЛИТЕРАТУРА IX класс Б, В -0ПОЯСНИТЕЛЬНАЯ ЗАПИСКА Статус документа Рабочая программа по литературе для IX класса создана на основе федерального компонента государственного стандарта основного общего образования, примерной программы основного общего образования по литературе и программы по литературе для общеобразовательных учреждений Программа литературного образования: 5-11 классы /под редакцией В.Я. Коровиной – М.: Просвещение, 2008. Программа...»

«ИНФОРМАЦИОННЫЙ БЮЛЛЕТЕНЬ № 43 ООО Интелект Образование ХХI Официальный представитель издательств Просвещение и Дрофа ДИСТАНЦИОННЫЕ КУРСЫ ПОВЫШЕНИЯ КВАЛИФИКАЦИИ УЧИТЕЛЕЙ ПО УМК ИЗДАТЕЛЬСТВА ДРОФА В МГУ ИМ. М. В. ЛОМОНОСОВА С 2015 года все школы нашей страны начнут работать по Федеральному государственному образовательному стандарту основного общего образования (ФГОС ООО). Стандарт второго поколения требует от педагога развития новых профессиональных компетенций, способствующих достижению...»

«Пояснительная записка Рабочая программа курса географии 9 класса разработана на основе: Федерального компонента государственного стандарта общего образования, утвержденного Приказом Минобразования РФ от 05.03.2004 г. №1089. Рабочей программы по предметной линии учебников СФЕРЫ 5-9 классы. – М.: Просвещение, 2011; Требований к оснащению общеобразовательного процесса в соответствии с содержательным наполнением учебных предметов Федерального компонента государственного образовательного стандарта...»

«СОДЕРЖАНИЕ 1. Общие положения Нормативные документы для разработки ООП бакалавриата по 1.1 направлению подготовки 040100 Социология 1.2 Требования к результатам освоения основной образовательной программы..5 1.2.1 Общекультурные компетенции..5 1.2.2 Профессиональные компетенции..6 2. Примерный учебный план 2.1 Пояснительная записка..9 2.2. Структура примерной образовательной программы по направлению Социология с вариантами распределения зачетных единиц (по результатам обобщения учебных планов,...»

«Министерство образования и науки Российской Федерации Беловский институт (филиал) федерального государственного бюджетного образовательного учреждения высшего профессионального образования Кемеровский государственный университет кафедра общественных наук Рабочая программа дисциплины Теория государства и права Направление подготовки 030900.62 Юриспруденция Квалификация (степень) выпускника Бакалавр Форма обучения Заочная (5 лет, сокращенная) Составитель: к.ю.н., доцент Бляхман Б.Я. Белово Print...»

«Николаевская астрономическая обсерватория Пулковская астрономическая обсерватория. Вклад Пулковской и Николаевской обсерваторий в создание опорной системы координат в период, предшествующий проекту HIPPARCOS. Е.В.Хруцкая. Пулково, 2009 Абсолютные определения координат звезд Пулковские инструменты: - большой пассажный инструмент Эртеля-Струве - вертикальный круг Эртеля-Струве Николаевские инструменты: Пассажный инструмент Фрейберга - Кондратьева (D=108 mm, F=1300 mm) Вертикальный круг Репсольда....»

«493 К О Н Ф Е Р Е Н Ц И И Soyuz.ru, или как нам обустроить отечественную антропологию 11–13 сентября 2007 г. в г. Пушкине при поддержке Государственного университета Высшая школа экономики прошла конференция Социальная антропология в России как исследовательская и университетская дисциплина: поиски прошлого и будущего. Организаторами выступили Ж. Кормина (ГУ-ВШЭ, СПб), С. Абашин (ИЭА РАН, Москва), Н. Ссорин-Чайков (Кембриджский университет, Великобритания). В конференции приняли участие...»

«Федеральное агентство по образованию Томский государственный университет Утверждаю: Декан филологического факультета _ проф. Т.А. Демешкина _2008 г. ЛАТИНСКИЙ ЯЗЫК Учебно-методический комплекс Специальность 021700 – ФИЛОЛОГИЯ Статус дисциплины: Федеральный компонент специальности Томск 2008 ОДОБРЕНО кафедрой общего, славяно-русского языкознания и классической филологии Протокол №1 от 1 сентября 2008 г. Зав. кафедрой, профессор _ РЕКОМЕНДОВАНО методической комиссией филологического факультета...»

«МИНИСТЕРСТВО СЕЛЬСКОГО ХОЗЯЙСТВА РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Саратовский государственный аграрный университет имени Н.И. Вавилова Утвериедаю Директор Пугачёвс^^о филиала Q z t b t i ^ / r j С е м ё н о в а О.Н./ 0% J^ г. РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ Дисциплина АНГЛИИСКИИ ЯЗЫК Специальность 080802.51 Прикладная информатика (по отраслям) Квалификация Техник выпускника Нормативный срок 3 года...»

«Записи выполняются и используются в СО 1.004 СО 6.018 Предоставляется в СО 1.023. Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Саратовский государственный аграрный университет имени Н.И. Вавилова Факультет пищевых технологий и товароведения СОГЛАСОВАНО УТВЕРЖДАЮ Декан факультета Проректор по учебной работе / Морозов А.А./ / Ларионов С.В./ _ г. _ г. РАБОЧАЯ ПРОГРАММА (МОДУЛЬНАЯ) по дисциплине Экономика АПК направление подготовки для...»






 
2014 www.av.disus.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.