«ЭПИДЕМИОЛОГИЯ И СТАТИСТИКА КАК ИНСТРУМЕНТЫ ДОКАЗАТЕЛЬНОЙ МЕДИЦИНЫ Пособие для студентов медицинских ВУЗов, интернов, аспирантов, клинических ординаторов, врачей, менеджеров и организаторов здравоохранения Тверь, 2009 ...»
Е.А. Корнышева, Д.Ю. Платонов, А.А. Родионов, А.Е. Шабашов
ЭПИДЕМИОЛОГИЯ И СТАТИСТИКА КАК ИНСТРУМЕНТЫ
ДОКАЗАТЕЛЬНОЙ МЕДИЦИНЫ
Пособие для студентов медицинских ВУЗов, интернов, аспирантов, клинических
ординаторов, врачей, менеджеров и организаторов здравоохранения
Тверь, 2009
Корнышева, Е.А. Эпидемиология и статистика как инструменты доказательной медицины [Текст] / Е.А. Корнышева, Д.Ю. Платонов, А.А. Родионов, А.Е. Шабашов ; издание второе исправленное и дополненное – Тверь, 2009. – 80 с.
В разработке пособия приняли участие:
Корнышева Елена Андреевна – к.м.н., магистр общественного здоровья, заведующая Тверским областным Центром медицинской профилактики Платонов Дмитрий Юрьевич – к.м.н., магистр общественного здоровья, доцент кафедры госпитальной терапии, заведующий кардиоревматологическим отделением ГУЗ Областная клиническая больница, г. Тверь Родионов Андрей Александрович – магистр общественного здоровья, ассистент кафедры общеврачебной практики и профилактической медицины с курсом основ доказательной медицины Шабашов Алексей Евгеньевич – к.м.н., магистр общественного здоровья, председатель Тверского отделения Межрегионального общества специалистов доказательной медицины, заместитель директора ГУЗ Медицинский информационно-аналитический центр Тверской области Первое издание осуществлено при финансовой поддержке Института Открытое Общество/Фонда Сороса, Россия в рамках проекта «Развитие партнерства с Браун Школой Общественного здоровья и коммунальной медицины Еврейского Университета, Иерусалима, государства Израиль». Консультант проекта профессор Браун Школы Общественного здоровья и коммунальной медицины Еврейского Университета (Иерусалим, Израиль) Теодор Тульчинский Методические рекомендации одобрены на методическом совете факультета последипломного образования, повышения квалификации и профессиональной переподготовки специалистов ТГМА (председатель – профессор Г.Л. Саввиди) и утверждены Центральным методическим Советом Академии (председатель – профессор М.Н. Калинкин), протокол №4 от 27 декабря © коллектив авторов,
ОГЛАВЛЕНИЕ
Предисловие ко второму изданиюПредисловие к первому изданию
Доказательная медицина как новый способ медицинской практики................. Эпидемиология как наука. Основные эпидемиологические термины и понятия, и их использование в доказательной медицине
Основные понятия методологии биомедицинских исследований
Описательная и аналитическая статистика как инструменты доказательной медицины
Источники медицинской информации
Оценка медицинских публикаций
Библиографический список
Предисловие ко второму изданию Пять лет прошло со времени первого издания данного методического пособия. Многое изменилось с тех пор. За это время вышли в свет два издания учебника «Эпидемиология», написанные нашим прекрасным другом и коллегой, вице-президентом Межрегионального общества специалистов доказательной медицины, профессором В.В. Власовым. Другой вице-президент Общества и наш не менее хороший друг профессор С.Л. Плавинский выпустил в Санкт-Петербурге очень полезную монографию «Биостатистика: планирование, обработка и представление результатов биомедицинских исследований при помощи системы SAS». Издательство Гэотар Медиа издает целые серии книг по доказательной медицине, включая многочисленные клинические руководства. Наконец, была разработана типовая учебная программа по преподаванию доказательной медицины для студентов медицинских институтов, за счет части учебных часов, отведенных на изучение общей эпидемиологии на кафедрах инфекционных заболеваний. Однако, по нашему мнению, пособие, которое вы держите в руках, ничуть не потеряло своей актуальности.
По-прежнему для студентов, врачей и всех тех, кто начинает заниматься доказательной медициной, существует дефицит доступной литературы, где были бы в равной степени освещены все необходимые вопросы. Поиск нужной информации в доступных источниках может стать длительным и трудоемким. Некоторые разделы эпидемиологии и статистики в соответствующей литературе описаны более подробно, чем это нужно для простого ознакомления с данными предметами. Нам представляется, что второе издание нашего пособия, будет полезно как для начинающих, так и для тех, кто давно уже практикует доказательную медицину. Для получения более глубоких знаний и навыков в некоторых частных вопросах эпидемиологии и статистики мы с удовольствием рекомендуем вам обратиться к упомянутым выше источникам.
Пособие было основательно переработано, в соответствии с опытом преподавания авторами вопросов доказательной медицины на до- и последипломном уровнях медицинского образования, как в России, так и за рубежом. Мы постарались учесть пожелания наших слушателей, курсантов и студентов.
от имени коллектива авторов А.А.Родионов Предисловие к первому изданию Термин evidence-based medicine впервые использован в 1992 г. в статье канадских ученых (D.L.Sackett, et al.) «Доказательная медицина. Новые подходы к обучению клинической практике». В ней впервые был предложен революционный для клинической практики принцип – врач должен уметь применительно к индивидуальному больному формировать клинические вопросы, отыскивать самые надежные ответы и использовать найденную информацию. По их определению – доказательная медицина (ДМ) – это интеграция лучших научных доказательств и клинических знаний при лечении пациентов с учетом их индивидуальных особенностей.
Группа канадских ученых (D.L. Sackett et al) впервые стала внедрять в процесс обучения научные принципы современной эпидемиологии и преподавание клинической эпидемиологии быстро распространилось в университетах передовых стран. Преподаватели клинических дисциплин высших учебных заведений знают принципы клинической эпидемиологии и современные источники доказательной информации. Они учат студентов самостоятельно находить надежную информацию на протяжении всей профессиональной жизни.
Принципы ДМ стали востребованы и общественным здравоохранением, т.к. появление в последние годы огромного числа новых методов диагностики, лечения, профилактики требовали оптимизации управленческих решений на основе анализа проверенных достоверных научных фактов.
ДМ стала широко использоваться в клинико-экономическом анализе при разработке стандартов в здравоохранении (протоколы ведения больных, экономическое обоснование целесообразности использования конкретных технологий и др.). В Великобритании, Канаде, США и Скандинавских странах появились Агентства по оценке новых медицинских технологий, которые всесторонне критически изучают новые методы диагностики, лечения и профилактики для принятия управленческих решений национальных и региональных служб здравоохранения.
В России идеи ДМ восприняты с энтузиазмом. Книга Р. Флетчера, С. Флетчера, С. Вагнера «Клиническая эпидемиология: основы доказательной медицины», В.В. Власова «Введение в доказательную медицину», ежегодный справочник «Доказательная медицина» идут нарасхват.
В медицинских ВУЗах нашей страны начинают преподавать основы ДМ. Так в Московской медицинской академии организован цикл по ДМ. В Московском медицинском университете и Тверской медицинской академии проводятся специальные курсы по ДМ на последипломном этапе образования. Помимо этого, в ТГМА на преддипломном этапе образования студенты изучают принципы ДМ. В рамках деятельности развивающихся школ общественного здоровья Москвы, Санкт-Петербурга, Твери и Челябинска широко преподаются вопросы ДМ.
Настоящее пособие призвано в какой то степени восполнить дефицит литературы по ДМ. В нем приводятся основные эпидемиологические термины, понятия методологии биомедицинских исследований. Большое внимание уделяется статистике – инструменту научного доказательного анализа. В пособии даются основные источники и оценка медицинских публикаций. Надеемся, что оно окажется полезным как начинающему исследователю, так и опытному организатору здравоохранения.
д.м.н., профессор, руководитель Отделения последипломного образования по программе Школы общественного здоровья ГОУ ВПО Тверская ГМА Росздрава
ЭПИДЕМИОЛОГИЯ И СТАТИСТИКА КАК ИНСТРУМЕНТЫ
ДОКАЗАТЕЛЬНОЙ МЕДИЦИНЫ
Доказательная медицина как новый способ медицинской практики В последние годы во всем мире отмечается лавинообразный рост интереса к доказательной медицине. Существует множество определений evidence-based medicine, переводимой на русский язык как «доказательная медицина». По мнению D. Sackett это объединение лучших фактов, клинического опыта и предпочтений пациента. Это не самостоятельная наука и не особый способ исследований. По сути – это способ медицинской практики, позволяющий провести разумный выбор вмешательств, подразумевающий процесс принятия решений на основе наиболее надежных из имеющихся на сегодня доказательств.Существует целый ряд предпосылок к широкому внедрению научно-доказательных подходов в медицинскую практику.
• Изменение структуры заболеваемости, появление большого количества новых способов лечения и диагностики вызывают ежедневную потребность клиницистов в новой, надежной информации.
• В процессе получения интересующей информации врачи сталкиваются с проблемой ее обширности, а, зачастую, и противоречивости. В связи с этим возникает потребность в формировании навыков эффективного поиска достоверных данных и критической оценке найденного по критериям достоверности.
• Высокая затратность медицинских технологий наряду с ограниченностью ресурсов здравоохранения во всех, даже экономически благополучных странах, приводят к тому, что новые методы диагностики и лечения не могут быть внедрены, если их эффективность не была доказана в ходе рандомизированных плацебо-контролируемых исследований.
• Рост образованности населения, широкая реклама лекарственных препаратов в средствах массовой информации, доступность медицинских знаний через Интернет в свете общей гуманизации обуславливают необходимость информирования пациентов о достоверности диагностических процедур, вероятности прогноза и исходов лечения. Окончательный выбор лечебных и диагностических мероприятий становится невозможным без учета предпочтений пациента и получения его согласия. Это также является одной из предпосылок развития доказательной медицины.
Процесс принятия клинических решений, построенный в соответствии с позициями научно-обоснованной медицинской практики, осуществляется в несколько этапов:
1. Формулирование клинического вопроса.
Полноценный поиск информации невозможен без грамотно сформулированного клинического вопроса, четко описывающего интересующую проблему. Хорошо сформулированный клинический вопрос обычно имеет следующую структуру:
• описание пациента или проблемы, • оцениваемое вмешательство или прогноз, Наиболее распространенные типы клинических вопросов касаются диагностики, лечения, этиологии и прогноза.
2. Поиск данных.
Определив проблему можно приступать ко второму этапу – поиску данных, отдавая предпочтение первичной прямой и сильной информации, т.е. результатам оригинальных исследований с хорошим дизайном. С современными источниками надежной медицинской информации и методикой полноценного поиска Вы можете ознакомиться в соответствующих разделах данного методического пособия.
3. Критическая оценка данных.
Это важнейший этап научно-доказательной медицинской практики. Для его реализации клиницисты и исследователи должны иметь представление о методологии исследований, основах клинической эпидемиологии, биостатистике, иметь навыки критической оценки информации, применяя критерии достоверности, разработанные для различных видов исследований (см. соответствующие разделы пособия).
4. Применение в клинической практике.
Реализация результатов полноценного поиска информации и ее критической оценки возможно на 2-х уровнях:
• уровень клинического случая – клиницист, оценив применимость данных в собственной практике и приемлемость для пациента, использует их для оказания помощи конкретному больному;
• уровень организаторов здравоохранения – данные используются для принятия управленческих решений.
5. Оценка эффекта.
На заключительном этапе следует провести оценку внедрения доказательной медицины:
• правильно ли был сформулирован клинический вопрос;
• была ли найдена необходимая информация;
• насколько успешно она реализована в практике.
При этом необходимо провести клиническую оценку, экономическую оценку и оценку удовлетворенности пациента. Последние два вида выходят за рамки данного методического пособия.
Контрольные вопросы по теме 1. Дайте определение термину «доказательная медицина»
2. Перечислите предпосылки к развитию доказательной медицины 3. Перечислите этапы принятия клинических решений в рамках доказательной медицины 4. Перечислите формы внедрения доказательной медицины Эпидемиология как наука. Основные эпидемиологические термины и понятия, и их использование в доказательной медицине В данном разделе речь пойдет об эпидемиологии, как базовой науке доказательной медицины, о терминах, понятиях и эпидемиологических процедурах, как инструментах доказательной медицины. Без базовых представлений и навыков в эпидемиологии критическое чтение медицинской литературы и проведение собственных исследований становится бессмысленным и даже вредным. Знания и навыки в эпидемиологии необходимы на всех этапах использования доказательной медицины, но, прежде всего, без них нельзя обойтись при критическом чтении публикаций (этап 3) и оценке вмешательства (этап 5).
Эпидемиология: понятие и суть Эпидемиология (epidemiology) – наука о распределении и детерминантах событий и состояний, относящихся к здоровью в определенных популяциях в приложении их к управлению и контролю проблем, связанных со здоровьем. Эпидемиология, исторически возникшая как наука о распространении инфекционных заболеваний, к настоящему времени вышла далеко за пределы этого узкого понятия, представляя собой фундаментальную науку о том, как часто и почему заболевания возникают в различных группах людей, какие детерминанты (биологические, многообразные факторы окружающей среды, в том числе и социального окружения, поведенческие факторы, способы лечения и оказания медицинской помощи) каким образом и в какой степени связаны со здоровьем.
Эпидемиологическая информация используется для того, чтобы планировать и оценивать стратегии, направленные на профилактику заболеваний, и как руководство по ведению пациентов, у которых заболевание уже развилась. Подобно клиническим и патофизиологическим данным, эпидемиология заболевания является неотъемлемой частью основного описания нозологической единицы.
Эпидемиология является фундаментальной и основополагающей наукой доказательной медицины ввиду того, что вооружает навыками интерпретации и критического осмысления результатов исследований, предоставляющих научные факты, учит использованию основных понятий, лежащих в основе доказательной медицины. Данная наука разрабатывает специальные методы, лежащие в основе сбора данных и их интерпретации, а также свой собственный жаргон для технических терминов.
Клинические наблюдения приводят к принятию решения относительно индивидуумов. Эпидемиологические наблюдения могут также принимать решения относительно индивидуумов, но в основном они связаны с группами людей. Важное фундаментальное различие в цели измерения накладывает различные требования к качеству данных (их источниках, качеству сбора и точности).
Задачи эпидемиологии:
• определить этиологию или причину болезни и ее факторы риска, т.е. факторы, которые увеличивают риск развития болезни с целью разработки научно-обоснованного базиса для превентивных вмешательств – для снижения заболеваемости, болезненности и смертности • изучить естественное течение и прогноз болезни с целью оценки того, действительно ли эффективны наши профилактические (первичная, вторичная и третичная профилактика) действия, и насколько течение болезни при их внедрении будет отличаться от естественного • провести оценку: новых превентивных и лечебных мероприятий, новых моделей оказания медицинской помощи • определить масштаб болезни, т.е. бремя для общества с целью планирования вмешательств, служб здравоохранения и подготовку[p3] специалистов, которые будут осуществлять вмешательства; провести мониторирование временных тенденций показателей здоровья • разработать обоснование для планирования политики в области охраны здоровья, а также принятия решений в отношении контроля тех или иных проблем, связанных с окружающей средой и образом жизни Первые три задачи имеют непосредственное отношение к доказательной медицине.
Основные понятия в эпидемиологии: понятия нормы и патологии, определение «случая» в эпидемиологии, показатели частоты новых случаев, показатели распространенности события, популяция и выборка, риски, шансы, относительный риск и другие риски, отношение шансов, связь (ассоциация) и ее проработка и детализация, валидность параметров и измерений, воздействие, факторы риска, маркеры риска, защитные факторы и их взаимодействия, случайные и систематические ошибки, вмешивающиеся факторы (конфаундинги), модификаторы эффекта, причины и следствия.
Понятие нормы и определение случая в эпидемиологии (norm, case) Определение нормы в эпидемиологии отличается от клинической медицины, различается в зависимости от типа эпидемиологических данных - дискретных или непрерывных. «Нормальный» используется, по меньшей мере, в трех значениях:
• в значении «обычный» (некоторые называют это «статистическим» подходом). В этом смысле нормальный диапазон можно определить недвусмысленными терминами – например, «диапазон от двух стандартных отклонений ниже среднего до двух стандартных отклонений выше среднего» или «между 10-ой и 90-ой процентилями». Но тогда «аномальный» означало бы только «необычный».
• в значении «желаемый» – т.е. диапазон значений, указывающих или предсказывающих хорошее здоровье (иначе это можно назвать «клиническим или прогностическим подходом). Клиническая важность может быть определена уровнем переменной, выше которой появляются симптомы, или более часто возникают осложнения. Прогностический означает, что имеется определенное пограничное значение, ниже которого значение показателя и прогноз является не связанными друг с другом. «Прогностически аномальный» определяется тогда именно этим уровнем. Но между «здоровыми» и «нездоровыми» данными четкой границы не существует, а существует некий градиент нормальности, а не ее дихотомичность. Можно решить, например, что любой результат с отношением правдоподобия 1 или менее – будет «нормальным»; но этот «нормальный» диапазон будет включать нескольких – а может быть и много людей с заболеванием.
• в значении «не требующий никаких действий» - т.е. нет необходимости в дальнейших исследованиях, обследованиях, лечебных или превентивных мероприятиях. Такое значение слова «нормальный» требует информации не только о взаимоотношениях между здоровьем и болезнью, но также и о возможной пользе вмешательства.
Использование того или иного значения определяется целью и задачами исследования, однако, в любом случае необходимо дать четкое определение тому, кого относить в группу лиц, имеющих «нормальное состояние» (в узком смысле, имеющим отношение к доказательной медицине, «болезнь, состояние, исход (конечный или промежуточный) отсутствуют, или «-») и лиц, его имеющих «+». То есть, важен так называемый операционный подход. Для практической работы требуется определение случая, хотя иногда и несколько произвольного, как основы для принятия решений.
Операционное определение для лечения может базироваться на пороговом значении.
Эта величина будет принимать во внимание симптомы и прогноз, но не будет четко определена ни одним из этих показателей. У пациента может не быть симптомов, но тем не менее он выиграет от начала лечения или, наоборот, у него может быть увеличенный риск, который не может быть исправлен.
Методика разделения исследуемых на «случаи» и «не-случаи» должна быть четко описана в методологии исследования (иначе говоря, должны быть даны операционные дефиниции изучаемым переменным, явлениям, включенным в изучение) и должно быть объяснено, почему именно эти критерии были выбраны. Чрезвычайно важно также определять и стандартизировать методы измерения выбранных критериев случая в эпидемиологии.
Воздействие (exposure) Воздействие – другое важное понятие в эпидемиологии, имеющее отношение к оценке связи – главной задачи эпидемиологического исследования – связи между воздействием и исходом. В Эпидемиологическом Словаре дается следующее определение воздействию: близость и/или контакт с источником заболевания, происходящие таким образом, что может произойти эффективная передача патогенного агента; количество определенного фактора, которому были подвержены индивидуумы, способное проникнуть в организм с тем, чтобы вызвать определенное состояние (болезнь), близко к понятию дозы; воздействие может иметь как отрицательное, так и положительное (защитное) влияние.
По аналогии с определением «случая» в эпидемиологии задача заключается в оперативном определении в континууме воздействия и его количества, индивидумов, подвергнутых воздействию (воздействие +) и не подвергнутых воздействию (воздействие -) с последующим внесением их в таблицу 2 Х 2 с расчетом относительного риска или отношения шансов. Необходимо подчеркнуть, что под воздействием в эпидемиологии принято понимать различные переменные, с общепризнанной точки зрения, таковыми не являющиеся, такие как время, возраст, пол. При этом имеется в виду, что наличие этих переменных по-разному воздействует на интересующий исход у изучаемой категории лиц. Эпидемиологическое исследование может начинаться с оценки воздействия (проспективное исследование), либо оценка воздействия может производиться после отбора случаев и контролей (ретроспективное исследование). Данные о воздействии наряду со случаями вносятся в четырехпольную таблицу (таблицу 2 Х 2) для расчета показателей связи.
Распространенность (prevalence) Показатель распространенности события (prevalence rate). Термин «показатель» в эпидемиологии является относительной величиной (рассчитывается по отношению к определенной группе индивидуумов и выражается дробью). Здесь необходимо отметить, что распространенность может быть выражена как в относительных, так и абсолютных значениях. Последние имеют более ограниченное применение, поскольку обычно используются для выражения масштаба проблемы в популяции; к доказательной медицине и исследовательской работе это может приложение для обоснования актуальности темы изучения или исследования.
Любой показатель в эпидемиологии может представлять собой пропорцию (например, показатель распространенности), когда числитель дроби содержится в знаменателе, так и не быть пропорцией (например, частота новых случаев).
Показатель распространенности события – это пропорция индивидов в группе или популяции, имеющих определенное заболевание или состояние в данный период времени, умноженное на 100, 1000 и т.д. Важным является то, что числитель дроби входит в знаменатель. По сути является «фотоснимком» изучаемой популяции в определенный момент времени.
Можно отметить, что показатель распространенности имеет несколько разновидностей (одномоментной распространенности, периодической распространенности, распространенности на протяжении жизни), хотя обычно (и если это не уточняется) речь идет об одномоментной распространенности. Показатель распространенности зависит от частоты новых случаев и продолжительности заболевания. До начала анализа показателя распространенности (это справедливо для начала анализа любых показателей, любых первичных данных в эпидемиологии) необходимо собрать информацию о том, как данные были получены (источники данных – числителя и знаменателя дроби) и насколько они точны.
Использование показателей распространенности: учитываются в постановке общинного диагноза и приоритизации проблем здоровья, при планировании вмешательств по охране здоровья, в качестве «претестовой вероятности» в диагностике заболеваний, позволяют определить группы, нуждающиеся в повышенном внимании, в некоторых случаях, при особых условиях для оценки эффективности программ при повторном изучении показателя распространенности.
Чрезвычайно важным является то, что показатель распространенности не является мерой риска, поскольку в исследованиях распространенности (одномоментные или поперечные исследования) нельзя установить временные взаимоотношения между воздействием и исходом и, следовательно, оценить риск наступления события. Ввиду этого факта, использование показателя распространенности в доказательной медицине имеет ограниченное значение. Однако его следует, как минимум, отличать от показателя частоты новых случаев, и хорошо представлять, с какими показателями имеют дело.
Частота новых случаев (incidence rate) Показатель частоты новых случаев (инцидентности) – указывает на скорость развития явления в изучаемой среде. Он определяется делением количества случаев события (заболевания) на количество людей, изначально его не имевших. Важным является период времени, за который определяется инцидентность. Данный показатель не является пропорцией, служит мерой риска развития заболевания у человека в течение изучаемого периода, обычно года (вероятности перехода индивидуума из знаменателя дроби в ее числитель). Выражается также в относительных показателях на 100, 1000 и т.д. То, что показатель частоты новых случаев является мерой риска, делает его важным показателем для изучения связи между переменными в эпидемиологии, что и составляет сущность эпидемиологии как науки. Оценивается данный показатель в проспективных (когортных) исследованиях.
Несмотря на сложность проблемы, все-таки следует указать, что существует и используется в литературе два типа показателей инцидентности с различными видами знаменателя: знаменатель, представленный количеством индивидов («количественный» знаменатель); такой показатель называется «кумулятивной частотой новых случаев» и знаменатель «человеко-время»; в данном случае он называется «плотностью частоты новых случаев». Оба типа показателей могут рассчитываться как для всей популяции в целом, так и для отдельных групп.
Смысл использования показателя «человеко-время» заключается в том, что обычно индивиды переживают различные по длительности «периоды риска». Это может происходить из-за того, что члены когорты перестают быть кандидатами на то, чтобы их состояние исследовали: они могут уехать, отказаться сотрудничать, потеряться или умереть, или стадия пребывания в риске может автоматически окончиться в результате наступления заболевания. Индивиды также могут включаться в исследование в разное время, что тоже будет порождать различия в «периодах риска». В подобных случаях показатель инцидентности (частоты новых случаев) находят путем деления общего количества случаев на общий период риска индивидов, измеренных в единицах человеко-время. Для расчета знаменателя должна быть рассчитана сумма периодов риска каждого индивида, т.е. продолжительность времени от начала наблюдения до выхода из-под наблюдения (включая выход из-за случаев развития состояния последней стадии) или до конца исследования.
Оба показателя можно рассчитать один из другого, пользуясь определенной формулой. Если заболевание редкое, размер популяции большой и, также как и ее состав, относительно постоянен, то можно пользоваться обычным показателем частоты новых случаев.
Стандартизация (standardization) Стандартизация, как метод, позволяющий сравнивать показатели здоровья – ряд технических приемов, позволяющих устранить как можно больше влияний возраста или других вмешивающихся переменных (стандартизовать, то есть контролировать переменные при анализе данных двух или нескольких популяций можно и нужно по любым переменным, связанным со здоровьем). Необходимость применения процедуры стандартизации обусловлена тем, что сравниваемые популяции обычно различаются пропорциональным распределением в них некоторых переменных, которые влияют на грубые показатели здоровья. Принцип метода заключается в применении взвешенных средних, специфических для контролируемых переменных. Существует две разновидности стандартизации: прямая и непрямая. Важно подчеркнуть, что стандартизованные показатели, в отличие от грубых показателей могут быть использованы лишь в целях сравнения, и не используются при оценке здоровья изучаемой популяции или общины, постановке общинного диагноза, при планировании и оценке вмешательств.
Процедура стандартизации широко применяется и используется, прежде всего, в общественном здоровье при сравнении популяций – их демографических и эпидемиологических характеристик, показателей здоровья. Однако, следует подчеркнуть, что метод стандартизации является одним из способов контроля вмешивающихся факторов (конфаундингов) – процедуры, являющейся обязательной при анализе любой связи в эпидемиологии и доказательной медицине. До тех пор, пока в сравниваемых группах, выборках не будут учтены неодинаковые пропорциональные распределения различных признаков или, говоря на эпидемиологическом языке, переменных (то есть их вклад или вес), которые могут вмешиваться и менять связь, заключение о связи будет ошибочным и не должно рассматриваться серьезно.
Таблицы и кривые дожития (life tables and survival curves).
При проведении многих исследований немаловажное значение имеет не только сам факт совершения какого-либо события, но и время его совершения. Этим событием может быть смерть (время до смерти индивида назовем временем дожития), появление какого-либо заболевания или осложнения, выздоровление, возвращение на рабочее место, беременность и т. д. Методы анализа, разработанные для изучения времени дожития и термины «время дожития» и «анализ дожития» часто используются по отношению к любому событию.
Построение кривой дожития – это один из способов обобщения результатов подобного исследования. Выживаемость на кривой построена против времени. Кривая может начинаться на показателе 100% и отражать кумулятивный показатель дожития; или она может начинаться на отметке «ноль» и показывать кумулятивный показатель частоты новых случаев или, в том случае, если этим «новым случаем» является смерть, – кумулятивный показатель смертности, что является дополнением к первой кривой. В знаменателях обоих показателей (как кумулятивного показателя дожития, так и кумулятивного показателя смертности) находится число, обозначающее количество индивидов, наблюдаемых в процессе исследования, они выражают средний риск выживания или не выживания на протяжении определенного периода времени. Пример кривой дожития представлен на рисунке 1.
% дожития Рисунок 1. Кумулятивный показатель дожития гипотетической когорты мужчин Тверской области, Российской Федерации в целом, Великобритании, Израиля и США 2005.
Источник: (Родионов А.А., Шабашов А.Е., Фомина Ю.Н., Ивашкив И.И., неопублик.) Используемая информация может основываться на прямом наблюдении группы людей, всех из которых наблюдают в течение всего периода, охваченного кривой. Обычно, однако, различных членов когорты наблюдают различные периоды времени, как правило, из-за их выхода из-под наблюдения или потому, что люди включаются в исследование в разное время. Кумулятивные показатели частоты новых случаев впоследствии можно рассчитать с помощью таблиц дожития Каплана-Мейера. Индивид может выйти из-под наблюдения по различным причинам, например, из-за наступления болезни, при котором пациент автоматически покидает группу риска, вследствие смерти пациента, в результате прекращения исследования или по другим причинам. В том случае, если в конце периода наблюдения заболевание так и не наступило, время дожития пациента «пересматривается» и требует особого внимания при его анализе.
При клинических испытаниях и других проспективных исследованиях часто сравнивается дожитие двух групп. Это обычно требует проведения особых статистических операций, направленных на учет пересмотренного времени дожития, таких, как логарифмический тест рангов, тест для различий между кривыми дожития. Отношение рисков или относительный риск (наступления случая) можно подсчитать, используя отношение рисков в двух группах в определенный период.
Популяция (population) Популяция в эпидемиологии в соответствии со словарем J.Last имеет два значения.
Это, с одной стороны все население данной территории или страны вместе; количество населения данной территории. Второе, более актуальное для нас определение гласит: популяция – совокупность единиц наблюдения, из которой отбирается выборка и на которую могут быть распространены результаты, полученные на этой выборке. Это необязательно люди или животные, единицами наблюдения могут быть организации, медицинская документация, больные лица и т.д. Важным является тот факт, что обобщать результаты исследования можно лишь только по отношению к той популяции больных, на выборке из которой проведено исследование (например, при анализе риска воздействия фактора на госпитализированных больных нельзя делать вывод о воздействии данного фактора риска на всех больных с данной патологией) Выборка (sample) Выборка – часть популяции, полученная путем отбора. Выборка может быть случайной и неслучайной, репрезентативной и нерепрезентативной. Для научнообоснованной оценки эпидемиологических данных имеет значение размер и процедура выборки, зависящие от задач и вида исследования, изучаемых параметров и собираемых данных.
Риск (risk) Риск – это основополагающее понятие в эпидемиологии, поскольку можно сказать, что эпидемиология как наука, базируется на концепции риска, и наступление события в эпидемиологии принято выражать через вероятности. Риск – это вероятность того, что у лиц, подвергшихся влиянию некоторых факторов, возникнет определенное состояние, например, они заболеют или умрут к определенному возрасту.
Риск рассчитывается отношением количества лиц с развившимся исходом («случаев») к общему числу наблюдаемых лиц, находящихся под воздействием определенного фактора. Риск применяется в эпидемиологии с целью прогнозирования событий, выявления причины события, в определении диагностических критериев и их надежности, в оценке лечения и профилактики. Риск связан с частотой новых случаев и определяет вероятность перехода индивида из знаменателя в числитель дроби. Важным является период времени, пока человек находился в риске (то есть в знаменателе дроби).
Риск определяется в когортном исследовании. Риск является ключевым понятием в исследованиях этиологии (факторы риска, или защитные факторы), диагностики (вероятность выявления болезни при ее наличии), лечения (вероятность наступления неблагоприятного исхода или выздоровления), профилактики, популяционном вмешательстве, прогноза (исход при определенной стадии болезни, у определенной популяции).
Относительный риск или отношение рисков (relative risk, risk ratio) Относительный риск рассчитывается как отношение риска наступления определенного события у лиц, подвергавшихся воздействию фактора риска (защитного фактора) к риску наступления этого события у лиц без воздействия изучаемого фактора. Является важным показателем меры связи для дискретных переменных. Служит основой для расчета атрибутивного (добавочного) популяционного риска и атрибутивной (добавочной) доли (фракции) – показателей, широко используемых в научно-обоснованных вмешательствах по охране здоровья. Интерпретация относительного риска: риск, равный 1 свидетельствует о том, что связь между переменными отсутствует; риск, превышающий 1, свидетельствует о положительной связи; риск меньше 1 говорит об обратной связи.
Разность рисков (добавочный риск) (risk difference, attributive risk) Разность рисков – показатель связи в эпидемиологии, выраженный через арифметическое вычитание одного риска из другого. Относительный риск и разница рисков имеют одинаковый смысл, но в доказательной медицине (клинической эпидемиологии) чаще используется отношение рисков, в то время как при принятии решения на популяционном уровне чаще используется разница риска, поскольку позволяет рассчитать вред, наносимый воздействием или фактором риска для данной популяции, или пользу от профилактического вмешательства (снижение риска для популяции при устранении воздействия). Для доказательной медицины этот показатель имеет значение в виду того, что на его основе рассчитывается важный показатель – число больных, которых необходимо лечить (ЧБНЛ). Эта величина указывает на то, сколько больных необходимо лечить определенным методом в течение определенного времени, чтобы достичь определенного благоприятного исхода или предотвратить один неблагоприятный исход. ЧБНЛ = 1/разница рисков в основной и контрольной группах.
Добавочный популяционный риск (population attributive risk) Добавочный популяционный риск – показатель, отражающий дополнительную заболеваемость в популяции, связанную с фактором риска. Рассчитывается как произведение добавочного риска (разницы рисков) на распространенность фактора риска в популяции.
Добавочная доля популяционного риска (population attributive fraction) Добавочная доля популяционного риска – доля случаев в популяции, обусловленная воздействием фактора риска, рассчитывается делением добавочного популяционного риска на показатель частоты новых случаев состояния, связанного с данным фактором риска. Если изучается не фактор риска, а защитный фактор, то этот показатель позволяет рассчитать, сколько (какую долю) новых случаев можно предотвратить путем воздействия на этот защитный фактор (внедрение нового вида лечения, профилактического вмешательства). Показатель широко используется в научно-обоснованном общественном здоровье при оценке действенности и эффективности (в том числе и экономической) превентивных вмешательств.
Фактор риска и маркер риска (risk factor and risk marker) Фактор риска и маркер риска – этот термин разными авторами используется, как минимум, в трех разных значениях.
1. Признак или воздействие, связанное с повышенной вероятностью определенного исхода, такого, например, как появление болезни. Необязательно причинный фактор. Маркер риска.
2. Признак или воздействие, увеличивающее вероятность появления болезни или другого определенного исхода. Детерминанта.
3. Детерминанта, которую может модифицировать какое-то вмешательство, при этом снижая вероятность появления болезни или других определенных исходов. Во избежание путаницы может называться «модифицируемый фактор В целях четкости, вероятно, лучше всего использовать термин «фактор риска только в том случае, если мы знаем, что этот фактор – причинный – т.е. что он увеличивает риск (определение 2), а не просто указывает на возрастающий риск (определение 1).
Если фактор просто указывает, но не обязательно несет с собой возрастающий риск, рекомендуется называть его маркером риска.
Шансы (odds) Шансы – отношение вероятности того, что событие произойдет, к вероятности того, что событие не произойдет. С точки зрения доказательной медицины можно дать более конкретное определение шансам как форме выражения вероятности развития определенного исхода, которое рассчитывается как отношение числа больных с данным исходом к числу больных без данного исхода. Шансы могут рассчитываться по отношению к исходу (заболеванию, смерти) и по отношению к воздействию (шанс быть подвергнутым воздействию у лиц с определенным исходом). Рассчитывается и оценивается в исследованиях по типу случай-контроль.
Отношение шансов (odds ratio) Отношение шансов – рассчитывается делением шансов наступления события или заболевания у лиц с воздействием на шансы наступления события у лиц без воздействия. Так же как и относительный риск, является одним из показателей силы связи.
Иногда (в случаях с редкими событиями или заболеваниями) отношение рисков и отношение шансов близки в своих значениях.
Связь (ассоциация) (association) Связь – ключевое понятие в эпидемиологии. Между двумя переменными существует связь, если вероятность того, что одна переменная (зависимая) будет иметь место, зависит от того, существует ли в наличии другая переменная (независимая). Связь может быть положительной и отрицательной. Меры силы связи – отношение рисков, разница рисков, отношение шансов, другие показатели силы связи (для непрерывных переменных). Алгоритм анализа связи в эпидемиологии (после оценки качества данных, оцениваемых в связи и способа их получения) включает шаги по оценке того, не является ли связь следствием случайной ошибки? Не является ли связь следствием систематической ошибки? Является ли связь причинной?
Четырехпольная таблица (таблица 2 Х 2) (2 X 2 table) Четырехпольная таблица – важнейший инструмент в эпидемиологии, позволяющий рассчитывать показатели связи (ее силу и направленность). Данный инструмент следует рассматривать как пособие при планировании сбора и анализа данных. В принципе, можно отметить, что любой анализ в эпидемиологии может и должен быть упрощен до такой степени, которая позволит заполнить все ячейки четырехпольной таблицы (таблица 1).
Таблица 2*2 по результатам клинического испытания Источник: (Родионов А.А., Шабашов А.Е. неопубл.) Сравнение рисков может проводиться несколькими способами:
1. Можно рассчитать абсолютную разность рисков (РР), иногда это также может называться добавочным риском (ДР) или снижением абсолютного риска(САР). Разность рисков в международной терминологии AR – attributive risk или RD – risk difference. В нашем случае РР = 0,79-0,6 = 0,19. Это говорит о том, что применение нового лекарственного препарата позволит дополнительно вылечить 19 человек из каждых 100 больных данным заболеванием. Само собой, значение добавочного риска равное 0 – говорит об отсутствии различия в исходах лечения лиц основной и контрольной групп, то есть – об отсутствии связи между изучаемыми воздействием и исходом.
2. Можно рассчитать относительный риск (ОР) или отношение рисков – международный термин RR - relative risk или risk ratio. Для нашего примера ОР = 0,79/0,6 = 1,32. Таким образом, риск выздоровления для пациентов основной группы в 1,32 раза больше, чем для основной. (Вероятность выздоровления при приеме нового препарата в 1,32 раза выше, чем при применении плацебо.) ОР может находиться в диапазоне от 0 до 1 (обратная взаимосвязь) и от 1 до бесконечности (прямая взаимосвязь). ОР = 1 говорит об отсутствии взаимосвязи между воздействием и исходом. Чем более ОР отличен от 1 в ту или иную сторону, тем сильнее взаимосвязь. Значение ОР зависит от того, делим ли мы риск для группы воздействие на риск для группы контроля или наоборот. Так, в нашем примере ОР = 0,79/0,6 = 1,32 или ОР = 0,6/0,79 = 0,76. То есть риск (вероятность) выздоровления при приеме плацебо в 0, раза выше, чем при приеме нового препарата. Другими словами ОР = 1,32 и ОР = 0,76 свидетельствуют об одинаковой силе (но разной направленности) Относительный риск и разница рисков имеют одинаковый смысл, в эпидемиологии чаще используется отношение рисков, в то время как в общественном здоровье, особенно при принятии решения на популяционном уровне чаще используется разница рисков. Она позволяет рассчитать вред, наносимый воздействием или фактором риска для данной популяции, или пользу от воздействия. На основе РР рассчитывается важный показатель – число больных, которых необходимо лечить (ЧБНЛ) – английский термин NNT – Number Needed to Treat. Эта величина указывает на то, сколько людей необходимо подвергнуть влиянию определенного фактора в течение определенного времени, чтобы достичь определенного благоприятного исхода или предотвратить ЧБНЛ = 1/разница рисков в основной и контрольной группах.
Процедура оценки связи (проработки, детализации связи) (elaboration of the association) Необходимо остановиться на данной базовой эпидемиологической процедуре с целью предостережения от поспешных выводов при получении информации о любой связи (то есть по сути конечной цели эпидемиологического исследования, на которых базируется доказательная медицина и общественное здоровье, основанное на доказательствах). Первым шагом при оценке любой связи должно быть достижение уверенности в качестве и точности полученных данных и способах их получения. Следующим шагом является осмысление связи, то есть ответ на вопрос, не является ли связь случайной или следствием систематической ошибки. Изучаются возможные вмешивающиеся факторы (конфаундинги), а также модифицирующие факторы (принимая во внимание тот факт, что нельзя быть до конца уверенным в том, что учтены все возможные влияния). Лишь после этого можно делать вывод о том, что связь существует в действительности, и рассматривать ее с точки зрения причинно-следственных взаимоотношений.
Конфаундинг-эффект (confounding-effect) Конфаундинг-эффект – искажение связи (усиление, ослабление, извращение) между двумя переменными (воздействием и исходом), вызванное присутствием внешнего фактора (третьей переменной). Когда речь заходит о конфаундинг-эффекте, то приводят его латинское происхождение (confundere –«смешивать вместе»). В любой связи такой эффект должен быть предположен и проверен, то есть доказан или не доказан.
Схематично конфаундинг-эффект изображен на рисунке 2.
Рисунок 2. Схема конфаундинг-эффекта (объяснение в тексте) Как видно из рисунка, третья переменная С (конфаундинг) должна влиять на исход (переменную В), что показано стрелкой, также должны быть связаны между собой переменные А и С (воздействие или независимая переменная) и конфаундинг. При этом связь между А и С не должна носить причинно-следственный характер, но переменная С должна оказывать влияние на А. Если связь между А и С сводится к влиянию А на С, тогда С нельзя рассматривать как потенциальный конфаундинг, и в этом случае переменная С является промежуточной причиной в цепочке зависимости между переменными А и В. Это представляет собой определенную дилемму в случаях, когда этиология связи А-В недостаточно изучена, и тогда необходимо принять во внимание и проверить обе эти возможности (что переменная С является конфаундингом или промежуточной причиной).
Конфаундинг-фактор является фактором риска для исхода не только в изучаемой группе, но и в группе контроля. Конфаундинг можно классифицировать как одну из разновидностей систематических ошибок в эпидемиологии, и ей всегда должно уделяться должное внимание. Проверить, является ли какой-либо фактор конфаундингом, и одновременно нейтрализовать его эффект (выражаясь эпидемиологическим языком – контролировать конфаундинг) можно методом стратификации. Этот метод заключается в определении связи между переменными А и В в каждой категории (страте) подозреваемого конфаундинга. Фактор будет считаться конфаундингом, если стратифицированные отношения показателей будут отличаться от отношения грубых показателей. При этом следует иметь в виду, что фактор может быть рассмотрен как конфаундинг лишь в том случае, если страта-специфические показатели связи (ОР или ОШ) довольно сильные, при этом статистическая значимость этих связей не имеет значения. Слабые связи – даже в случае их высокой статистической значимости – вряд ли могут оказывать конфаундинг-эффект, в то время как сильные связи, даже при их статистической незначимости (что, может быть связано, в первую очередь, с малым размером выборки) могут оказывать существенный конфаундинг-эффект.
Другим методом проверки и контроля конфаундинга является стандартизация (прямой и, в случае использования подходящего стандарта, непрямой методы). Если стандартизованное отношение показателей отличается от отношения грубых (нестандартизованных) показателей, то это указывает на наличие конфаундинга.
Процедура проработки связи на наличие конфаундинга включает два этапа – первый, это оценка того, является ли фактор потенциальным конфаундингом, для чего необходимо изучить связь между конфаундингом и обеими (зависимой и независимой) переменными. Второй шаг заключается в анализе того, действительно ли потенциальный фактор вмешивается в изучаемую связь. Для этого сравнивают отношение грубых показателей с отношением показателей, рассчитанных после контроля конфаундинга любым способом.
Необходимо отметить, что конфаундинги могут усиливать, ослаблять связь или менять направленность связи. Логично, что отсутствие связи между двумя переменными вовсе не исключает необходимости ее проработки на наличие конфаундинга, также конфаундинг может приводить к видимой ассоциации там, где в действительности ее не существует.
Поиск потенциальных конфаундингов должен включать несколько (их может быть достаточно много) переменных, имеющих отношение к изучаемому явлению в эпидемиологии. Нельзя быть уверенным в том, что вы исключили все возможные вмешивающиеся факторы. Но процедура проработки связи должна быть описана, из которой должно следовать, что исследователь предпринял эти попытки[p23]. Это следует иметь ввиду при проведении, анализе и публикации собственных исследований, при чтении литературы, при отборе исследований в мета-анализ, при оценке мета-анализа.
Иногда оценка конфаундингов позволяет расценить связь с новой точки зрения, отметить новые черты в ассоциации, а иногда вмешивание проливает свет на этиологию эпидемиологических событий.
Влияние конфаундинга можно учесть и уменьшить (но лишь до определенной степени, и нельзя опять-таки быть уверенным, что осуществлен контроль всех конфаундингов) на стадии планирования исследования, то есть отбора субъектов (рандомизация, адекватный подбор контролей, процедура спаривания), на стадии анализа результатов путем проведения одной из следующих процедур (стандартизации, стратификации, применения многофакторного статистического анализа).
Универсальными конфаундингами являются пол и возраст, поскольку именно эти переменные заменяют и включают в себя множество факторов, так или иначе, влияющих на здоровье.
Эффект модификации (modification effect) Эффект модификации – тип взаимодействия переменных (трех), при котором сила связи между двумя переменными зависит от уровня некоторой третьей переменной, называемой модификатором эффекта. Таким образом, связь может проявляться лишь в определенной группе лиц (страте), в которой имеется третья переменная (модификатор), либо различаться по своей силе или направленности в зависимости от этой третьей переменной.
Процедура предположения и выявления модификатора связи (например, стратификация), также как и в случае с конфаундинг-эффектом, является обязательной при анализе любой связи. Часто бывает так, что связь имеет место только в одной из страт, где имеется модификатор, и не имеет место в другой. Эффект модификации часто является ключом к разгадке связи и учитывается при формировании целевых групп для вмешательств.
Взаимодействие переменных (interaction) Взаимодействие переменных – эффект модификации часто проявляется в виде эффекта взаимодействия двух переменных, который бывает положительным (усиливающим влияние на зависимую переменную) и отрицательным. Первый вариант имеет отношение к синергизму, явлению, при котором сочетанный эффект двух взаимодействующих переменных (например, двух факторов риска, социально-демографических характеристик) больше объединения их эффектов в отдельности. Такой синергизм может проявляться в виде аддитивной (основанной на разнице различий) и множительной (основанной на относительных различиях) моделей. Необходимо отметить, что в определенных случаях может иметь значение одна модель, и не «работать» другая. Аддитивный синергизм имеет большее практическое применение в общественном здоровье, в то время как множительный может оказаться полезным при изучении этиологических процессов.
Концепция причинности в эпидемиологии (causality) Анализ связи в эпидемиологии на причинность является последним звеном в анализе ассоциации (после проверки ее на наличие случайных и систематических ошибок). В эпидемиологии используется концепция «паутины причинности», которая включает множество событий и атрибутов, связанных друг с другом разнонаправленными воздействиями. Причины всегда множественны; любой фактор, изменение которого может привести к изменению следствия может рассматриваться как причинный. Однако поскольку практически невозможно найти причины, которые могут быть расценены как необходимые и достаточные, то принято говорить не о причинах, а о факторах, увеличивающих вероятность наступления следствия.
Поиск причинных факторов начинается с формулировки исследовательской гипотезы с учетом принципа Оккама. При этом гипотеза должна быть проверяемой, то есть сбор фактов, необходимых для ее проверки, должен быть осуществимым (для удобства и одновременно для проверки «осуществимости» сбора данных полезно предварительно спланировать макет таблицы, в которую будут заноситься первичные данные, а также четырехпольную таблицу для анализа проверяемых ассоциаций).
Доказательства причинности в эпидемиологии: последовательность во времени, сила связи – достаточный относительный риск (отношение рисков), зависимость эффекта от дозы, обратимость, устойчивость – эффект наблюдается разными исследователями, в разных условиях, биологическое правдоподобие –согласование с современными научными представлениями, специфичность: одна причина - один эффект, аналогия – доказаны сходные взаимодействия.
Случайные ошибки в эпидемиологии (random errors) Эпидемиология имеет дело с двумя разновидностями ошибок – случайными и систематическими. Случайные ошибки – это ошибки, не связанные с методикой проведения исследования, то есть, происходящие исключительно ввиду случайности.
Такие случайности, например, происходят ввиду исключительно случайного отклонения результата отдельного наблюдения (измерения) от его истинного значения, случайного распределения лиц в группе исследования и контроля.
Все такие случайности (они не поддаются учету и просто объясняются действием случая) в конечном итоге могут привести к тому, что полученный результат будет лишь проявлением случая. Также как и систематические ошибки, случайные ошибки нельзя исключить, для их контроля используются тесты на статистическую значимость, являющиеся неотъемлемой частью любого эпидемиологического исследования. Несмотря на то, что проверке статистической значимости посвящен отдельный раздел пособия, необходимо отметить, что их значение не указывает на силу связи между переменными, а свидетельствует лишь о вероятности случайных ошибок или влияния случая на наблюдаемый результат, полученный на выборке, а не на генеральной совокупности. Важным также является замечание о том, что при наличии выраженных систематических ошибок, статистически значимый результат, свидетельствующий о том, что вероятность случайной ошибки мала, не имеет никакого научного и практического значения.
Систематические ошибки в эпидемиологии (смещения) (biases) Систематические ошибки в эпидемиологии – отклонение результатов или заключений-выводов от истинного значения, а также, процессы, приводящие к этим отклонениям. Под смещением понимают любую тенденцию в сборе, анализе, интерпретации, публикации или обзоре эпидемиологических данных, которые систематически отличаются от истины.
Происхождение систематических ошибок связано с тем, что исследования выполняются на людях, и они могут иметь сопутствующие практические и этические ограничения. Они связаны также с вариацией биологических параметров, с ограничениями техники измерения (технологические, стоимостные, этические). Это может быть систематическое одностороннее отклонение от истинных значений первичных измеренных параметров; отклонение вторичных (обработанных) статистических данных (средних, относительных показателей, параметров связи и.т д.), возникающих в результате смещений в исходных данных, а также различных погрешностях в сборе данных, дизайне исследований или анализа; отклонения в заключениях и обобщениях, связанных с погрешностями в дизайне исследования, сборе, интерпретации или анализе данных; а также непреднамеренным отбором методов исследования. Термин «ошибка» не связан с понятием преднамеренности или субъективного фактора, такого, как например, желание исследователя какого-либо определенного исхода. Выделяется множество разновидностей систематических ошибок.
Систематические ошибки или смещения обычно не могут быть полностью удалены из эпидемиологических исследований. Поэтому целью исследования должно быть сведение их к минимуму, идентификация тех систематических ошибок, которых нельзя избежать, оценка их потенциального воздействия, и принятие их во внимание при интерпретации результатов. Планирование эпидемиологического исследования строят таким образом, чтобы предусмотреть возможные систематические ошибки, хотя полностью их исключить не бывает возможно. На стадии анализа результатов оценка систематических ошибок проводится на этапе анализа связи в эпидемиологии.
Все систематические ошибки можно классифицировать на ошибки отбора и ошибки информации, особым образом можно выделить ошибку, связанную с действием вмешивающегося фактора или конфаундинга. Подробнее о систематических ошибках также написано в разделе «Методология исследования».
Когортный эффект (cohort effect) Когортный эффект связан с колебаниями в состоянии здоровья, в основе которых лежат различные факторы, такие, как окружающая среда и социальные изменения, влиянию которых подвергается каждая группа рожденных в популяции. Каждая такая группа подвергается воздействию уникальной окружающей среды, существующей в период жизни этой группы.
Валидность (validity) Понятие валидности в эпидемиологии. Данное понятие имеет чрезвычайно важное значение в эпидемиологии, имеет несколько значений и относится к нескольким явлениям. Слово «валидность» происходит от латинского validus, что значит «сильный»).
В целом валидность означает достоверность результата или вывода. Первое значение термина относится к оценке метода измерения какой-либо характеристики. Валидность измеренного параметра – это степень адекватности измерения, производимого данным методом; насколько хорошо он измеряет то, что мы исследуем?
Основными характеристиками диагностических тестов являются характеристики их точности (график, отражающий диагностическую точность теста называется характеристической кривой): специфичность, чувствительность, прогностическая значимость положительного результата, прогностическая значимость отрицательного результата, отношение правдоподобия. При наличии «золотого стандарта» определить диагностическую точность теста проще, чем при его отсутствии. В последнем случае используют такие критерии, как предсказательную валидность (насколько результат теста согласуется с последующими клиническими событиями и исходами), ответ на лечение (какие изменения в состоянии здоровья повлечет лечение, назначенное при положительном результате теста), повторяемость или надежность (если результат не воспроизводим, то это указывает на его низкую валидность, однако, хорошо воспроизводимый результат может также иметь низкую валидность).
Все эти замечания имеют непосредственное отношение к доказательной медицине, к определению «случая» и «не-случая» и «воздействия». При низких параметрах диагностической точности имеет место систематическая ошибка – разновидность систематической ошибки информации и происходит так называемая ошибочная классификация лиц на группы имеющих состояние или исход или не имеющих. Такая систематическая ошибка, или ошибочная классификация приводит к ложному усилению или ослаблению связи. Направление и степень такого смещения можно легко рассчитать пользуясь четырехпольной таблицей, и их всегда надо учитывать при оценке результатов и их применении, поскольку практически всегда мы пользуемся тестами, имеющими диагностическую точность, отличную от 100%. Валидность диагностического теста является важной сферой скрининга, имеющей множество клинических, экономических и этических последствий. Очень важным является то, что валидность имеет значение не только к лабораторным или инструментальным тестам, но и к часто используемым в эпидемиологии вопросникам. Валидизация вопросников имеет свой канон правил и представляет собой отдельную трудоемкую процедуру.
Второе значение термина «валидность» – это его применение к исследованию в целом (валидность исследования) или к выводам, сделанным в результате этого исследования. Например, выводы о причинных связях плохо обоснованы в том случае, если не уделено должного внимания возможным артефактам, действию случайностей и конфаундингам. Исследование невалидно, если оно не дает точной информации и не позволяет сделать хорошо обоснованные выводы об исследуемой популяции. Это иногда называется внутренней валидностью исследования. Валидность исследования может нарушаться в результате систематической ошибки при отборе или систематических ошибок, возникающих при обработке информации, неконтролированного конфаундинга, неоправданно маленькой выборкой или другими факторами.] Третье значение валидности. Этот термин также используется, если мы хотим распространить данные, полученные в результате исследования определенной популяции, на более широкую популяцию. Это внешняя валидность исследования.
Внешняя валидность исследования определяется репрезентативностью выборки, ее размером и способом формирования.
Контрольные вопросы по теме 1. Дайте определение эпидемиологии.
2. Перечислите основные задачи эпидемиологии.
3. Перечислите разновидности показателей распространенности.
4. Перечислите разновидности показателей частоты новых случаев.
5. Перечислите разновидности методов стандартизации.
6. Дайте определения популяции и выборке.
7. Дайте определение эпидемиологического термина «риск».
8. Дайте определение относительного риска.
9. Дайте определение разности рисков.
10. Дайте определение отношения шансов.
11. Дайте определение конфаундингу.
12. Дайте определение случайной ошибке.
13. Дайте определение систематической ошибке.
14. Дайте определение валидности.
Основные понятия методологии биомедицинских исследований Организация научного исследования В научном исследовании отчетливо прослеживаются четыре больших этапа. Первоначально пишется аннотация своего исследования, в которой обобщенно представлена информация о том, зачем, почему и как исследование будет планироваться, проводиться, какие результаты ожидаются, и что с ними надлежит делать. Второй этап включает собственно сбор материала в соответствии с принципами, описанными в аннотации. На третьем этапе – производится обработка и анализ данных исследования, а на заключительном – обнародование результатов. Этапы могут не всегда проводиться строго последовательно, иногда одни этапы накладываются на другие.
Написание аннотации (research proposal) Обзор литературы (literature review) Критический литературный обзор по теме должен отражать всю информацию об интересующей проблеме, которая имеется на день подготовки работы. Современные возможности и средства поиска литературы не позволяют ссылаться на «доступные источники», обособлять отечественных и зарубежных авторов в процессе критического анализа информации. Данные и ссылки не должны быть устаревшими, за исключением незначительного количества действительно «классических» работ высокого качества, обойтись без упоминания которых не представляется возможным.
Цель (purpose) Описывая цель исследования, необходимо указать для чего производится исследование, какую проблему с его помощью удастся решить. В цели очень кратко должно быть отражено будущее практическое применение полученной информации.
Название работы (title) Название работы представляет собой краткое выражение цели исследования. Оно не должно быть расплывчатым и всеобъемлющим. Так, если не исследуется глобальная проблема целиком, а освещается лишь часть ее, целесообразно использовать конкретный заголовок, увидев который, читатели поймут, чем именно планирует заниматься исследователь.
Задачи исследования (objectives) Задачи исследования должны быть конкретными с указанием методов, которыми их собираются решать. Например: «оценить уровень качества жизни женщин страдающих ревматоидным артритом с помощью опросника SF-36.»
Исследовательские гипотезы (research hypothesis) В аннотации должны быть отражены исследовательские гипотезы, то есть то, что планируется обнаружить в результате работы. Они должны опираться на имеющиеся литературные данные и быть очень конкретными. Например, не следует использовать такие обороты как «значительно распространено», «большое значение». Следует указать, какая именно распространенность постулируется, в чем выражается это значение. Например, «раннее выявление рака молочной железы на 15% снижает уровень смертности».
Тип исследования (study design) В аннотации обязательно должен быть указан тип исследования (см. раздел «Классификация исследований»). Каждому типу исследования присущи свои собственные достоинства и недостатки, и исследователю предстоит выбрать наилучший доступный дизайн с учетом идеальных условий и конкретных возможностей.
Операционные определения переменных (operation definitions of variables) Следует указать операционные определения всех переменных, которые будут измерены и оценены (какое содержание исследователь вкладывает в тот или иной термин).
Например, «курение табака - выкуривание одного или более табачного продукта [сигарета, папироса, трубка, сигарилла, кальян или другое табачное изделие, предназначенное для курения] в день. К числу курящих, также относятся лица, курившие в прошлом, но отказавшиеся от регулярного курения менее чем 12 месяцев назад. Используется дихотомическая шкала (да/нет)». Это нужно для того, чтобы у исследователей и впоследствии у читателей, которые работают над обзором по теме, складывались верные представления о том, что данный ученый на самом деле имеет в виду, и на основании каких критериев включенные в исследования лица были разделены на группы.
Критерии включения/ исключения объектов исследования (including/ excluding criteria) Объект исследования должен быть охарактеризован как можно более полно. Для этого необходимо указать критерии включения и исключения из исследования, например: «С целью формирования групп вмешательства и контроля планируется проанализировать архивные истории болезни всех женщин, находившихся на стационарном лечении продолжительностью более 24 часов в x отделении y больницы за период 1979-1999 гг. Из исследования были исключены лица с сопутствующей ИБС, сахарным диабетом, лица в возрасте 60 лет и старше на момент формирования выборки.
Итоговый размер выборки составит 20% от общего количества лиц, удовлетворяющих критериям включения. При этом указывается, что часть женщин, удовлетворяющих всем критериям, в конечном итоге не будет включена в исследование (умершие, переехавшие в другой район, отказавшиеся от обследования и т. д.). Эта группа также должна быть подробно описана, для того чтобы оценить, не отличается ли выборка и лица, выбывшие из исследования систематически по каким-либо характеристикам, поскольку это может повлиять на результаты».
Общее количество лиц, не вошедших в исследование из числа соответствующих критериям включения должно быть невелико (обычно не более 20%). В противном случае достоверность результатов эксперимента значительно снижается.
Процедура выборки (sampling procedure) В случае выборочных исследований должны быть очень четко и полностью описаны процедура выборки, способы формирования основной и контрольной группы, описаны процедуры, которые были использованы (рандомизация, стратификация и др.).
Методики сбора и анализа данных (data gathering and analysis procedure) Сообщается, будет ли стандартизована процедура обследования, и каким образом, будут ли обучены лица, ее непосредственно проводящие, какие возможные систематические ошибки присущи этому исследованию, какие базы данных будут созданы, и как ими будут управлять. Должны быть указаны статистические тесты, которые планируется использовать, уровни максимально допустимой - и -ошибки для тестирования статистических гипотез, используемая аппаратура и программное обеспечение.
В настоящее время в среде отечественных ученых модным становится использовать все более изощренные статистические процедуры, поскольку доступность специализированного программного обеспечения значительно выросла. Следует отметить, что никакие статистические методы не могут повлиять на систематические ошибки, имеющиеся в исследовании. Более того, использование любых статистических приемов в работе с дизайном невысокого качества бессмысленно.
Финансирование исследования В аннотации необходимо указать источники финансирования исследования. Это позволяет узнать, не будут ли задействованы в работе те лица, структуры, организации и компании, которые заинтересованы в определенных результатах исследования и могут повлиять прямо или косвенно на качество полученных данных. Большое количество современных клинических исследований в медицине в России производится на средства и при участии фармацевтических компаний и производителей медицинского оборудования, интересы которых отличаются от реальных потребностей населения в том или ином виде медицинской помощи.
Обработка результатов исследования Описание результатов Все заявленные переменные должны быть представлены в виде сводной таблицы, для того чтобы можно было проследить весь путь анализа взаимосвязей. Средства описательной статистики (таблицы, графики и др.) помогут лучше донести основные находки исследования до потребителя.
Оценка гипотез, обсуждение, формулирование новых гипотез для будущих исследований Результаты исследования должны быть представлены полностью в соответствии с задачами. Методы аналитической статистики должны соответствовать особенностям исследования. Требованием дня сегодняшнего является использование, помимо парных сравнений, методов многофакторного моделирования (множественная линейная регрессия, логистическая регрессия и т. п.), которые позволяют исключить влияние других переменных на выявленные при парных сравнениях взаимосвязи. Следует помнить, что статистическая значимость еще не говорит о том, что различие значимо клинически. С другой стороны, статистически недостоверные различия могут быть на практике высоко значимыми.
Обсуждение полученных результатов представляет собой завершающую аналитическую часть любой работы и заключается в сравнении полученных результатов с исследовательскими гипотезами, сформулированными на основе критического обзора литературы. Исследователь должен представить результаты тестирования всех гипотез и свои размышления о причине полученных различий или сходств с исследованиями, проведенными ранее. Выводы должны полностью соответствовать заявленным задачам исследования. Побочная информация, полученная в исследовании, но не постулированная в задачах, не может являться доказанным фактом и служить основанием для выводов. Допустимо лишь привлечь внимание читателей к незапланированным находкам и предварительно попытаться сформировать на их основе новые исследовательские гипотезы для будущих исследований.
Обнародование результатов исследования Доклады результатов Доклады результатов исследования являются существенным, но необязательным элементом научной работы. Более того, участие в семинарах и симпозиумах часто спонсируют фармацевтические компании, что может являться причиной конфликта интересов (выступления могут быть ангажированы). Это, безусловно, нужно учитывать (и учитывается) в процессе составления и оценки систематических обзоров, как фактор способный повлиять на качество представленных данных.
Публикация Публиковать результаты исследования необходимо всегда. Практика показывает, что даже самые аккуратные исследователи не любят публиковать данные исследований, имевших отрицательные результаты. Это абсолютно недопустимо и приводит к систематической ошибке (ошибка публикации) в процессе подготовки обзоров литературы. Отсутствие «отрицательных» результатов исследований в отечественных медицинских журналах вызывает недоверие к качеству проводимых научных работ. Публикация научной статьи в серьезном (зарубежном) реферируемом и рецензируемом журнале – непростая задача. С другой стороны, только таким публикациям склонен доверять читатель, знакомый с навыками критического чтения литературы. Грамотно написанная статья должна включать все то, что было заявлено в аннотации исследования (подробно), результаты, выводы и обсуждение. Повторные и дублирующие публикации по результатам одного исследования не допускаются.
Методологические проблемы биомедицинских исследований Сплошные и выборочные исследования Различают сплошные и выборочные исследования. Под сплошными исследованиями в широком смысле подразумевают изучение самой генеральной совокупности (человечества). В более узком смысле – это исследование всех интересующих нас случаев на определенной территории (например, всех случаев смерти, всех случаев ИБС, перепись населения). Качество данных, полученных в таких работах, очень высокое, и изученные показатели очень точно характеризуют исследованную популяцию. Однако такие исследования крайне дороги, сложны и, как правило, под силу только государству с его мощной законодательной базой, исполнительным аппаратом, налоговой системой и большим размером государственного бюджета. Выборочные исследования (статистические исследования, исследования статистической совокупности в отечественных учебниках социальной гигиены) представляют собой обследование части популяции – выборки. Данные, полученные на такой выборке, мы можем с большим или меньшим основанием распространить на всю популяцию.
Репрезентативная и не репрезентативная выборки Репрезентативность (представительность) – свойство выборки представлять популяцию. Следует помнить, что абсолютно репрезентативных выборок не бывает, в такую идеальную выборку должно входить все люди, составляющие генеральную совокупность, по отношении к которой данные будут обобщены (например, все жители города, страны и др.). Нерепрезентативная выборка не соответствует популяции по интересующим нас параметрам. Например больные ИБС в выборке не могут представлять население в целом, ученики 6-го А класса школы №89 не могут представлять взрослое население, олимпийская сборная пловцов не соответствует популяции пенсионеров и т.п.
Способы повышения репрезентативности выборки Многоцентровой дизайн Рак желудка для жителя Японии более успешно курабелен, чем для европейца или американца. Результаты Фремингемского исследования сердца неплохо представляют популяцию «средних» белых американцев, проживающих на восточном побережье США, но неспособны предсказать риск развития болезней сердца для жителей Средиземноморского бассейна (Испания, Португалия). Для того чтобы нивелировать влияние таких различий, исследование приходится проводить одновременно (или почти одновременно) в разных местах. И чем больше таких мест, тем лучше.
Такой многоцентровой дизайн исследования помогает сделать выборку более репрезентативной за счет включения в нее новых выборок, составленных из лиц, проживающих на других территориях. По результатам многоцентрового исследования можно вычислить риски, как для всей выборки, так и для «территориальных подвыборок» ее составляющих.
Рандомизация и способы формирования выборки Все выборки можно разделить на вероятностные и те, дизайн которых не основан на вероятностях.
Вероятностные выборки (probability [random] sample) называют еще рандомизированными.
Рандомизация (randomization) представляет собой процедуру формирования представительной выборки, когда шансы каждого индивидуума попасть или не попасть в выборку равны. С этой целью мы можем, например, пронумеровать амбулаторные карты в поликлинике от 00001 до 99999, сложить одинаковые бумажки с соответствующими номерами в барабан лототрона и затем случайным образом вытащить 100 бумажек. В идеальном случае, процедуру рандомизации должен проводить посторонний человек, вот почему во всех лотереях в отборе карточек (шаров, бочонков и т.д.) участвует представитель тиражной комиссии, который не является представителем организатора лотереи. Такой дизайн выборки называется простым (simple random sample).
Зонная выборка (area sample) – метод формирования выборки, который может быть использован в том случае, когда размер популяции неизвестен. Вся зона, используемая для формирования выборки, делится на «под-зоны», подобно тому, как сетка накладывается на карту. Этим «под-зонам» присваиваются номера, после чего некоторые из них отбираются случайным образом. Население выбранных зон может также быть пронумеровано, и отобрано на заключительном этапе.
При кластерной выборке (cluster sample) случайным образом отбираются не сами лица, а группы лиц (городской квартал, класс школы, семья и т.п.).
Захватывающая выборка (выборка удобства) [grab sample, sample of convenience] – удобный для проведения, но не-основанный-на-вероятностях метод выборки. Примером может служить обследование людей на улице или измерение артериального давления (АД) всем желающим в фойе кинотеатра. Метод значительно подвержен влиянию систематических ошибок (см. раздел посвященный систематическим ошибкам).
Стратифицированная случайная выборка (stratified random sample) подразумевает деление всей популяции на подгруппы в соответствии с какой-то важной характеристикой (возраст, национальность, религия или социо-экономический статус) и производится случайная выборка внутри каждой страты. Если, например, процент лиц в возрасте 54-54 года в области 20%, то таким же он будет и в выборке.
Систематическая выборка (systematic sample) – это процедура, подчиняющаяся простому систематическому правилу: все лица в картотеке на определенную букву, рожденные в определенный день недели, каждый третий в картотеке, и т.п. Систематическая выборка подвержена влиянию систематических ошибок, что ограничивает возможности экстраполяции результатов, полученных на этой выборке на всю популяцию.
Многоуровневая выборка (multilevel [multistage] sample) – представляет собой комбинацию тех или иных способов формирования выборки. Так, например, процесс формирования выборки можно разделить на ряд этапов. На первом этапе, случайным образом осуществляется кластерная выборка из регионов страны, на втором – случайная кластерная из административных районов отобранных регионов, на третьем – стратифицированная по национальному признаку случайная выборка.
Случайные ошибки исследований (errors) Ошибки присущи всем исследованиям. Их можно подразделить на случайные и систематические. Определения даны в разделе «Эпидемиология как наука. Основные эпидемиологические термины и понятия, и их использование в доказательной медицине»
Случайные ошибки и статистика Случайные ошибки не связаны с каким либо предпочтением, неправильностями в формировании выборки, неодинаковым наблюдением за различными группами обследуемых и т.п., а представляют собой случайные вариации изучаемой переменной.
Величина случайной ошибки зависит от размера выборки, распространенности изучаемого явления в популяции и разнообразия изучаемого признака. Аналитическая статистика, а точнее оценка статистической достоверности полученных результатов позволяет учесть влияние случайной вариации переменных.
Размер выборки (sample size) Исследователю выгодно, чтобы выборка имела небольшой размер. Это позволяет сохранить и более рационально использовать силы и средства. Однако при малом количестве объектов наблюдения влияние случайных вариаций может существенным образом исказить результаты исследования или вообще лишить смысла выводы, сделанные по результатам такой работы. Таким образом, определение минимально допустимого размера выборки имеет очень большое значение. Эту величину можно определить по специальным формулам или использовать компьютерную программу (например, PEPI). Расчет размера выборки несколько различается для разных типов исследований, но в общем можно сказать, что: он зависит от величины планируемых и ошибок, распространенности состояния в популяции и вариабельности признака.
Систематические ошибки или смещения (bias) К систематическим ошибкам ведут любые смещения в сборе, анализе, интерпретации, публикации или обзоре эпидемиологических данных, которые систематически отличаются от истины. Все этапы научного исследования могут служить источниками систематических ошибок.
Так смещенным может быть постановка исследовательской темы, вопроса и гипотез, когда они показывают одну популяцию в худшем или лучшем виде, чем другую и создают чувство превосходства одних людей над другими. Например, исследовательская гипотеза, что мужчины умнее женщин является смещенной. Такая ошибка не имеет специфического названия в эпидемиологии, хотя иногда ее называют ошибкой исследовательского вопроса. Она относится к виду концептуальных ошибок.
Смещенный выбор популяции – формирование выборки на основе простоты проведения исследования или культурных предпочтений исследователя. Это – ошибка популяции (population bias). Она относится к виду ошибок отбора и включает в себя ошибки добровольного участия в исследовании (volunteer bias), ошибки пола (sex bias), расы (race bias) и др.
Кроме того, к ошибкам отбора относятся смещения, которые приводят к ограничению генерализуемости результатов, связанные с тем, что выборка является представительной не по отношению ко всей популяции, а лишь к ее части. Примером, такой ошибки является «эффект здоровых рабочих» (healthy workers effect), поскольку работающее население имеет как правило лучшее состояние здоровья, чем население в целом.
Также, можно сказать, что исследование хорошо сделанной выборки студентов/ школьников, обобщаемо по отношению к популяции студентов/ школьников, а не ко всему населению, которое включает в себя лиц, не обучающихся в школе, ВУЗе.
Смещения, связанные с участием в исследовании. Так исследование госпитализированных пациентов является смещенным, по отношению ко всей популяции больных данным заболеванием, поскольку госпитализированные пациенты имеют сопутствующие проблемы со здоровьем, которые повышают шансы госпитализации. Это ошибка Берксона (Berksonian bias).
Неодинаковые усилия и время, затраченные для приглашения к участию, ведут к неадекватному представительству в выборке различных частей популяции. Такая ошибка – ошибка ответа (response bias), как и ошибка Берксона также относятся к ошибкам отбора.
Смещение, вызванное сравнением различных популяций, когда одна исследовательская группа старше (беднее и т.п.), чем другая ведет к неправильной интерпретации данных из-за неучета влияния других переменных (конфаундеров). Такая ошибка называется конфаундинг фактором или вмешиванием(confounding).
К смещениям, вызванным неправильным измерением заболеваний и факторов, которые их могут вызвать, относятся: ошибка диагностики – неодинаковые усилия и возможности диагностики для разных групп изучаемой популяции; неточные и неодинаковые измерения переменных – ошибка измерения; неодинаковая память на прошлые события у обследованных – ошибка воспоминания (recall bias); неодинаковые усилия по сбору данных в сравниваемых популяциях (workup bias); различная технология сбора данных в различных группах исследуемых – ошибка интервью (interview bias). Все эти виды смещений можно отнести к ошибкам информации (information bias).
Смещение, вызванное обследованиями в период наблюдения и измерением исходов. К ним относятся неодинаковые усилия для контакта между исследователем и субъектом исследования по вине, как первого, так и второго – ошибка отбора (selection bias), неодинаковые пропорции субъектов выбывших из исследования и оставшихся под наблюдением (selection bias), неодинаковое вмешательство по охране здоровья при изучении эффективности программ профилактики – ошибка вмешательства, неодинаковое участие в исследовании в разных группах – ошибка участия (participation bias).
Смещение, связанное с анализом и интерпретацией данных – это потенциальное наличие предпочтительного исхода, по мнению исследователя – ошибка интерпретации (interpretation bias) или ошибка презентации (presentation bias).
Смещение, связанное с отчетом, только об отдельных находках исследования. Исследователи чаще и с большей охотой публикуют интересные данные или данные исследований, имеющих положительные результаты. Подобное смещение – ошибка публикации (publication bias) может также возникнуть в связи с тем, что ряд данных невозможно или нельзя опубликовать, по тем или иным причинам.
Смещение, связанное с интерпретацией, суждениями и действиями читателей возникает вследствие того, что читатели и слушатели склонны интерпретировать данные в приемлемой (или доступной) для себя форме. Такая ошибка называется ошибкой интерпретации (interpretation bias).
Смещение, связанное с неправильным отнесением объекта исследования в категорию, к которой он не относится, называется в литературе ошибочной (неправильной) классификацией (misclassification.
Классификация исследований Схематично дерево эпидемиологических исследований представлено на рисунке 3.
Рисунок 3. Типы эпидемиологических исследований - адаптировано из Demonstration Disk. Distance Learning Course in Epidemiology: Principles and Practice. London School of Hygiene and Tropical Medicine. В обсервационных исследованиях – в отличие от экспериментальных, исследователь не влияет на распределение воздействия и/ или исхода. Эксперимент же целиком зависит от «прихоти» ученого-экспериментатора.
Экспериментальное исследование (trial) Эксперимент представляет собой исследование, применяемое для проверки гипотез, путем регистрации результатов специфического воздействия на исследуемую популяцию. В простом неконтролируемом эксперименте воздействие осуществляется на всех индивидуумов, входящих в данную популяцию. Этот дизайн исследования в большинстве случаев является неприемлемым, поскольку не позволяет отделить специфический эффект вмешательства от неспецифического (плацебо-эффект, эффект Готорна) и естественного течения состояния. Некоторые эпидемиологи называют такой дизайн научной работы квази-экспериментом (quasi-experimental survey).
Контролируемый эксперимент (controlled trial) позволяет решить эту проблему, поскольку группы исследования и контроля различаются именно по специфическому воздействию (вмешательство у первых и плацебо у вторых).
Основная и контрольная группа при формировании могут испытывать влияние систематических ошибок отбора и представлять собой смещенные выборки (biased sample).
Достоверность полученных в таком эксперименте данных вызывает серьезные сомнения. Способом, позволяющим уменьшить вероятность таких ошибок, является рандомизация (randomization).
Знание объектом исследования, экспериментатором или статистиком информации, о том к какой группе относится конкретный индивид, могут повлиять на чистоту эксперимента. Поэтому открытому, немаскированному (opened, unmasked) исследованию предпочитают маскированное, слепое (masked, blinded). Различают простое ослепление, когда объекты исследования не располагают информацией о своей принадлежности к той или иной группе исследования. Двойное слепое маскирование (double-blind) предпочтительнее. При нём экспериментатор тоже не владеет информацией о принадлежности испытуемого к конкретной группе. Это позволяет уменьшить смещения, связанные с предпочтением исследователя. Иногда используют тройное ослепление (triple-blind method), когда неинформированными являются и лица, проводящие анализ данных.
Наивысшей степенью доказательности по отношению к обследуемой популяции, при прочих равных условиях, обладает рандомизированное, контролируемое, двойное или тройное слепое исследование (РКИ) (randomized controlled double- or triple-blind trial).
Исследование с перекрестным дизайном (cross-over design) – еще более доказательно, но, к сожалению, ограниченно применимо в медицинских исследованиях. При этом после оценки исходов и расчета рисков основную и контрольную группы меняют между собой, повторно производится воздействие, и оцениваются риски. Таким образом, каждый индивидуум по очереди является объектом воздействия и контролем, то есть получается своего рода подбор пар (matching).
Правильно организованное и проведенное РКИ позволяет получить четкий результат, рассчитать риски, оценить дозозависимый эффект и возможность наличия причинно следственных связей.
Пример: РКИ по оценке эффективности пневмококковой вакцины у ВИЧ инфицированных лиц. Участники были случайным образом разделены на основную и контрольную группы – те, кто получал вакцину и получал плацебо.
К недостаткам РКИ относится их существенная дороговизна, длительные сроки проведения для значимых исходов и этические проблемы экспериментирования на людях.
Оценка риска и измерение взаимосвязи в эксперименте Проводится с помощью четырехпольной таблицы (таблица 2).
Четырехпольная таблица для анализа данных РКИ Воздействие было Воздействия не было - лица из группы воздействия, у которых в течение периода наблюдения развился специфический исход - лица из группы воздействия – не развился специфический исход - лица из контрольной группы – развился специфический исход - лица из контрольной группы – не развился специфический исход - численность группы воздействия - численность контрольной группы Мы можем оценить риски специфического исхода в разных группах и сравнить их:
Риск для группы воздействия Рискв = a/(a+b) Риск для контрольной группы Рискк= c/(c+d) Меры взаимосвязи в РКИ Разница рисков (РР) [rate difference, risk difference, excess risk] – абсолютная разница между двумя рисками, т.е. риск наступления специфического исхода у лиц, подвергшихся воздействию на {величина PP} больше, чем у лиц в контрольной группе.
Отношение рисков или относительный риск (ОР) [relative risk, risk ratio, rate ratio {RR}] – отношение риска специфического исхода в группе воздействия к риску для группы контроля, т.е. риск для группы воздействия в {величина ОР} раз больше, чем для группы контроля.
Когортное исследование (cohort study) Когортное исследование (КИ) – исследование в котором одна или более групп населения сходные по каким-либо параметрам (когорты) наблюдаются в течение определенного времени для оценки специфических исходов.
Пример: когортное исследование, изучающее эффект курения табака на смертность. Был изучен статус курения большой группы врачей, и проведено наблюдение за ними в течение 30 лет для регистрации смертельных случаев. Изучена частота смертельных случаев у курящих и некурящих.
КИ обладают высокой степенью доказанности (однако, меньшей, чем РКИ), и их широко используют для получения высококачественных данных, особенно в условиях, когда проведение эксперимента невозможно по этическим причинам. Как и эксперимент, когортное исследование позволяет оценить риски как меры взаимосвязи, (РР, ОР) но, в отличие от эксперимента, позволяет оценить частоту новых случаев (incidence) воздействия и исхода, поскольку и тот и другой признак распространены в популяции естественным образом (а не отбираются по дизайну исследования).
Для выявления значимых исходов, когортные исследования требуют наблюдения больших популяций в течение длительного времени, крайне дороги, очень трудоемки, и не подходят для изучения редких заболеваний.
Иногда в когортном исследовании собирается информация о наличии тех или иных факторов риска (ФР) у обследованных в прошлом. Такой дизайн (ретроспективный или псевдоретроспективный, или исторический [retrospective {historical} cohort]) значительным образом сокращает временные и финансовые затраты на исследование, но к сожалению он менее доказателен, чем обычное проспективное КИ.
Оценка риска и измерение взаимосвязи в когортном исследовании Производится также как и в РКИ. Место групп воздействия и контроля занимают когорты (например, курящие и некурящие). Четырехпольная таблица по данным КИ строится следующим образом (таблица 3).
Четырехпольная таблица для анализа данных когортного исследования Фактор риска есть Фактора риска нет - лица, находящиеся под воздействием фактора риска, у которых в течение периода наблюдения развился специфический исход - лица, находящиеся под воздействием фактора риска – не развился специфический исход - лица, не находящиеся под воздействием фактора риска – развился специфический исход - лица, не находящиеся под воздействием фактора риска – не развился специфический исход - численность когорты, находящейся под воздействием фактора риска - численность когорты, не находящейся под воздействием фактора риска - число новых случаев специфического исхода в популяции - число лиц, у которых не развился специфический исход - общая численность исследуемой популяции Риск(фактор+) = a/(a+b); Риск(фактор-) = c/(c+d); РР = a/(a+b) – c/(c+d); ОР = Частота _ новых _ случаев _ специфического _ исхода _ за _ время _ наблюдения = a+b+c+d Исследования случаев (case studies) Выделяют исследование единичного случая (case report), исследование серии случаев (case series study) и исследование случай контроль (case-control study). Их отличие от других исследований индивидуального риска в том, что исследование планируется не на основе воздействия предполагаемого фактора риска (как в когортном исследовании) или реального вмешательства (как в РКИ), а на основе уже имеющихся исходов (заболевание и т.д.).