ГБОУ ВПО
Самарский государственный медицинский университет
Минздравсоцразвития России
И. П. КОРОЛЮК
МЕДИЦИНСКАЯ ИНФОРМАТИКА
Учебник
Издание 2-е, исправленное и дополненное
Рекомендовано Учебно-методическим объединением по медицинскому
и фармацевтическому образованию вузов России в качестве учебника
для студентов медицинских вузов Самара 2012 УДК 61.002(075.8) ББК 5ф:32.81а73 К68 Автор Королюк Игорь Петрович – заслуженный деятель науки России, лауреат премии Правительства России, доктор медицинских наук, профессор кафедры лучевой диагностики и лучевой терапии с курсом медицинской информатики Самарского бюджетного государственного медицинского университета Рецензенты:
А.И. Жданов – доктор физико-математических наук, профессор, заведующий кафедрой прикладной математики ГОУ ВПО «Самарский аэрокосмический университет им. академика С.П. Королева»
Н.А. Карлова – доктор медицинских наук, профессор, заведующая кафедрой лучевой диагностики и лучевой терапии Северо-Западного государственного медицинского университета им.И.И. Мечникова Королюк И.П.
К68 Медицинская информатика : Учебник / И.П. Королюк. – 2 изд., перераб. и доп. – Самара : ООО «Офорт» :
ГБОУ ВПО «СамГМУ». 2012.— 244 с; ил.
Во втором издании (первое вышло в 2006 г.) с позиции системного подхода изложены основы медицинской информатики. Представлены сведения о характере медицинских данных, особенностях их сбора, хранения транспортировки и обработки. Дается понятие об информации в медицине и ее свойствах. В краткой форме представлены сведения о медицинской технике, используемой в медицине. Изложены сведения о компьютерных сетях различного уровня, включая Интернет и телемедицину. Представлены основные пакеты прикладных программ, используемых в медицине.
Достаточно подробно изложен материал по доказательной медицине, определению операционных характеристик диагностических методов, ROC-анализу. Освещены основы работы с медицинской литературой, которые базируются на принципах доказательной медицины.
Все права авторов защищены.
Ни одна часть этого издания не может быть занесена в память компьютера либо воспроизведена любым способом без предварительного письменного разрешения издателя.
ISBN 978-5-473-00746-6 @ И.П. Королюк, @ И.П. Королюк, 2012.
@ ГБОУ ВПО «СамГМУ», @ ООО «ОФОРТ». Автор выносит благодарность ректору Самарского бюджетного государственного медицинского университета за помощь в этом издании
ПРЕДИСЛОВИЕ
КО ВТОРОМУ ИЗДАНИЮ
Со времени выхода в сет первого издание этого учебника (2006 г.) прошло 5 лет. За этот период медицинская информатика претерпела большие изменения. Прежде всего, появились новые компьютерные технологии, новые технические и программные средства, обеспечивающие высокотехнологические направления здравоохранения и медицины. Резко возросла роль телекоммуникаций, Интернета. По-новому стали выглядеть рабочие места врачей и служащих в области здравоохранения: вместо рутинной бумажной документации теперь на столе удобно расположился компьютер. При этом возросла роль использования сетевых ресурсов Всемирной паутины, в частности использования «облачных технологий». В практической медицине начали использоваться специализированные компьютерные медицинские приложения, повышающие эффективность диагностики и лечения. В обиход студентов и врачей входят электронные книги. Повседневной реальностью стали портативны компьютерные устройства – гаджеты, «читалки», планшеты.Существенно возросла роль доказательной медицины – основы научных исследований и врачебной практике. Теперь специалисты оперируют терминами информативности диагностики и объективными показателями итогов лечения.
При освоении медицинских знаний студенты все более широко привлекают электронные средства информации – учебники, сетевые ресурсы Интернета, методические разработки. Все это ставит медицинскую информатику в ряд наиболее развивающихся медицинских дисциплин.
Автор
ВВЕДЕНИЕ
Современное общество можно охарактеризовать как информационное пространство, в котором сосредоточена общность людей с различными профессиональными и жизненными навыками, безотносительно к степени образованности, возраста, пола и расы.Начиная с раннего детского возраста, ребенок сталкивается с компьютером и быстро ассимилируется в информационную среду, состоящую первоначально из игровых приставок компьютерных игр. С возрастом у человека возникает все больше и больше потребностей и задач, которые он может разрешать с помощью компьютера. Уже в школе информационные технологии начинают доминировать в процессе познания окружающего мира.
С развитием Интернета компьютер становится не только средством общения, но также источником всевозможных сведений, ранее порою недоступных и непонятных. Электронная почта становится обыденностью и постепенно вытесняет эпистолярный жанр. В Интернете образуются группы людей по интересам, осуществляется доступ к самым различным изданиям, как общего, так и специального, в том числе медицинского назначения. Огромное значение для формирования современного человека приобрели Социальные сети.
Годы обучения в средних и высших учебных заведениях закрепляют и развивают полученные ранее навыки общения с компьютером. Постепенно компьютерная грамотность становится неизбежным атрибутом современного культурного человека.
Значительный прогресс в компьютеризации общества был обусловлен созданием глобальной компьютерной сети, или Интернета, который связал незримыми нитями всю нашу планету, все уровни среды обитания человека: дома, на работе, в клубе, гостинице, в уличной толчее. Современные технологии беспроводного доступа в Интернет обеспечивают надежную связь человека со всем миром. По Интернету можно получить практически все интересующие вас данные – о погоде, новых событиях дня, новинках литературы, войти и получить сведения в открытых базах данных по любому интересующему вопросу.
Значительный рост применения компьютерных технологий наблюдается в медицине и здравоохранении. Сейчас трудно представить себе современное лечебное учреждение без электронной регистратуры, аптечной сети, бухгалтерии, компьютеризированных рабочих мест врачей и среднего медицинского персонала. Часто компьютерные технологии связываются в единую сеть, которая включает в себя не только информационные средства, но и методы диагностики и лечения. Входит в практику обмен медицинскими данными между отдельными поликлиниками, больницами, университетскими центрами. Широкое распространение начинает получать новое направление оказания медицинских услуг – телемедицина. Она обеспечивает квалифицированную медицинскую помощь на удаленных от центра врачебных участках.
Мощным современным направлением компьютеризации медицины стали новые высокотехнологичные методы диагностики, такие как компьютерная и магнитно-резонансная томография, дистанционный мониторинг за состоянием больного в лечебном учреждении и на дому. Широко применяются цифровые методы при скрининге: цифровая флюорография для выявления туберкулеза легких, цифровая маммографии с целью обнаружения возможного рака молочных желез. Нарушения ритма сердца четко диагностируются компьютером при проведении суточного холтеровского мониторинга.
Количество компьютеров, ныне работающих в современном здравоохранении, трудно, да и невозможно учесть, ибо их рост идет повсеместно и большими темпами. Подобная ситуация создает новый феномен – информационного медицинского общества, осуществляющего свои функциональные задачи в сложной и многоуровневой информационной среде.
Настоящее издание призвано познакомить читателя с основами медицинской информатики – своеобразного раздела информатики как науки, отличающегося, однако, некоторым своеобразием, исходящим из особенностей практической медицинской деятельности.
Медицинскую информатику, таким образом, можно определить как науку, изучающую приемы создания, обработки, хранения, защиты, передачи и представления данных в медицине и здравоохранении средствами компьютерной техники. Важным разделом медицинской информатики является также объективная оценка медицинских данных на основе теории принятия решений и доказательной медицины.
В системе образовательного процесса в медицине, как в средних, так и высших учебных заведениях, можно условно выделить несколько разделов, в частности такие как:
• медицинская информация и медицинские данные, • системы представления медицинских данных, базирующиеся на компьютерной технологии, • аппаратное обеспечение медицинской информатики, • программное обеспечение медицинской информатики, • коммуникация в медицине и здравоохранении, • медицинские изображения, • оценка информативности медицинских исследований, • принципы доказательной медицины.
Каждый из вышеперечисленных разделов включает в себя обширный перечень вопросов, в той или иной степени близких непосредственно к медицине, либо представляющих собою частное приложение к общей информатике как отдельной области знаний.
Попутно отметим, что термин информатика – французского происхождения, образовавшийся в результате слияния терминов Informacion – информация и Automatique – автоматика. Им пользуются во Франции, некоторых странах Восточной Европы и России. В то же время в большинстве стран Европы, Азии и Америке (и заметим, в Интернете) более распространен термин Computer Science – наука о вычислительной технике. Данную особенность терминологии необходимо учитывать при международном общении и поиске необходимой информации в Интернете и периодической печати.
Глава
МЕДИКО-БИОЛОГИЧЕСКИЕ ДАННЫЕ
1.1. ВИДЫ МЕДИКО-БИОЛОГИЧЕСКИХ ДАННЫХ Все биологически активные процессы, происходящие в человеческом организме, сопровождаются выработкой различных сигналов – электромагнитных, звуковых, механических. Сигналами в медицине могут быть также сведения о состоянии человека – например, его росте, массе тела, составе крови и других биологических жидкостей, сигналами являются объективные и субъективные признаки заболеваний – жалобы больного, лихорадка, желтуха, результаты физикальных исследований. Применительно к информационным технологиям в области организации здравоохранения сигналами служат различные цифровые показатели, например, заболеваемости, смертности; сигналами могут являться также сведения о финансовых, человеческих и материальных ресурсах, циркулирующих в сфере медицины, здравоохранения и связанных с ними областях хозяйственной деятельности.При взаимодействии биологических сигналов, возникающих в организме человека, с физическими телами (детекторами) в последних могут возникать определенные изменения их свойств, которые регистрируются специальными приборами. У человека сигналы поступают в головной мозг для последующего анализа.
И в том, и в другом случае происходит регистрация сигналов. Зарегистрированные сигналы в информатике называются данными.
Медико-биологические данные, касающиеся здоровых людей и больных, могут быть систематизированы в следующие группы:
1. Количественные данные – параметры; их можно охарактеризовать дискретными величинами: рост пациента, концентрация в крови форменных элементов и биологически акh. o. j%!% *. l,,…“*=,…-%! =2,*= тивных веществ, заболеваемость туберкулезом в группе населения, количество ВИЧ-инфицированных больных и др.
2. Качественные данные – признаки; они не поддаются точной оценке, хотя и могут быть ранжированы (т.е. систематизированы по условным баллам: один балл, два балла и т.д.).
К таким данным относятся, например, цвет кожных покровов, наличие болей, качество жизни человека и др. Качественные признаки, которые могут быть отнесены только к двум категориям (их наличию или отсутствию), называются дихотомическими.
3. Статические картины органов человека или всего его тела;
они отображают картину пациента человека, различных участков патологически измененных тканей, чаще всего с помощью средств лучевой диагностики – рентгенологической, радионуклидной, ультразвуковой, магнитно-резонансной;
например, патологические изменения на рентгенограмме грудной клетки, сонограмме, изображение головного мозга на компьютерной томограмме. К статическим картинам относят фотографии макропрепаратов и гистологических срезов, эндоскопические изображения.
4. Динамические картины органов человека; они получаются при непрерывной регистрации (на мониторе или жестком диске компьютера) движущихся органов, например, сердца, легких, при изучении быстроменяющихся картин прохождения по организму рентгеноконтрастных или радионуклидных веществ (при рентгенологическом исследовании пищеварительного тракта, радионуклидном исследовании 5. Динамические данные физиологических функций: электрокардиограмма, электроэнцефалограмма, кривые, зарегистрированные при прохождении радиоактивного вещества Таким образом, зарегистрированные сигналы, называемые теперь данными, могут иметь различную форму отображения. Однако приведенная выше группировка в известной степени условна, ибо одна и та же характеристика пациентов в зависимости от способов регистрации сигнала может выступать в различных группах. Например, при радионуклидном исследовании почек полученные данные могут быть представлены в виде статического их изображения. Они могут быть представлены также в виде непрерывной динамической картины этих же изображений. При соответствующей компьютерной их обработке они могут иметь вид кривых, отражающих функцию почек, содержать числовые параметры и описательные протоколы. При исследовании кардиологического больного данные о состоянии сердца могут иметь вид кривых электрической активности (ЭКГ), визуального изображения отдельных камер сердца или сердечной мышцы при сонографии или магнитно-резонансной томографии, количественной и качественной характеристики работающего сердца и протекающей в нем крови.
1.2. ОЦЕНКА МЕДИКО-БИОЛОГИЧЕСКИХ ДАННЫХ
При оценке медико-биологических данных следует четко выделять два различных понятия – признак и параметр, поскольку каждый из них по-разному обрабатывается средствами информационных технологий.Признак – это характеристика пациента (или явления), которая может иметь только два значения: наличие или его отсутствие. Признаками являются, например, наличие болей, лихорадка, покраснение кожных покровов, припухлости в какой-то части тела, определение патологического образования на рентгенограмме грудной клетки, деформация зубцов ЭКГ.
Параметр – это величина, характеризующая свойство процесса, явления или системы в абсолютных или относительных величинах. Параметрами являются, например, показатели температуры тела и артериального давления, концентрации в крови отдельных веществ, изменение интервалов между зубцами на ЭКГ, размер выявленного патологического образования на рентгенограмме, распространенность заболевания среди населения.
Деление медико-биологических данных на признак и параметр, также как и в изложенной выше классификации данных, в какой-то степени условно. Для удобства обработки данных на компьютере признак можно перевести в разряд параметра, если характеризовать данное свойство по условной шкале. Например, выраженность припухлости можно оценить в баллах: один балл, два балла и т.д., желтуху как проявление заболевания можно охарактеризовать уровнем концентрации билирубина в крови. Аналогичным образом параметр может стать признаком, если оценка его будет проводиться альтернативно (дихотомически): наличие или отсутствие повышенной температуры тела пациента (лихорадки), повышенного артериального давления крови (гипертензии). Все это нужно учитывать при подготовке данных для последующей информационной компьютерной обработки.
При подготовке медико-биологических данных для их последующей обработки, в том числе компьютерной, нередко возникает необходимость применения различных шкал измерения. Существует несколько таких шкал.
Шкала наименований – это группировка объектов и их производных в ряд непересекающихся классов. При этом считается, что все объекты, принадлежащие к одному классу, являются идентичными, а к разным классам – различными. К шкале наименований относятся симптомы и синдромы заболеваний. Так, к шкале наименования относится, например, классификация патологических затемнений легочных полей на рентгенограмме грудной клетки: они могут быть округлыми, треугольными, иметь очаговый или тотальный характер. Цвет кожных покровов может иметь обычную, желтушную, красную или синюшную окраску. Шкала наименования представляет собою наиболее простое деление свойств объектов.
Шкала порядка – это упорядоченная шкала наименований, на которой отражена, в основном, тенденция процесса. На такой шкале признаки объектов представлены в восходящем либо в нисходящем значении. На такой шкале, например, можно расположить в возрастающем порядке концентрацию гормонов в крови у больных с тиреотоксикозом, степень желтушности кожных покровов, скорость оседания эритроцитов крови.
Интервальная шкала – это шкала с наличием единицы измерения. Примером такой шкалы является шкала температур термометра, в котором единицей измерения является один градус (или его доля).
Шкала отношений – это интервальная шкала с нулевой точкой, т.е. имеющей такую точку, в которой данный параметр практически отсутствует. Примерами такой шкалы являются измерительная линейка, ростомер, весы.
1.3. ЭТАПЫ ОПЕРАЦИИ С МЕДИКО-БИОЛОГИЧЕСКИМИ ДАННЫМИ
1. Сбор и первичная обработка данных – это накопление результатов исследований в том объеме, который задан условиями поставленной задачи или необходимостью принять адекватное решение. Существуют специальные правила, определяющие объем требуемых данных для каждого класса задач. Собранные данные подлежат первичной обработке, которая включает в себя отсечение «лишних», некорректно зарегистрированных сигналов. Первичная группировка реализуется по типу данных и классам изучаемых явлений.
2. Оценка эффективности измерения данных – это определение степени точности и величины погрешности зарегистрированных сигналов и полученных данных.
3. Cохранение данных – это регистрация данных в виде твердых копий или на магнитных носителях.
4. Формализация и стандартизация данных – это сведение всех полученных данных к единой форме, которая должна соответствовать требованиям компьютерной обработки и обеспечивать сопоставимость всех данных между собою, а также доступность их для всех заинтересованных пользователей.
5. Фильтрация и очищение данных – это отсеивание лишних сигналов, обусловленных неточностью работы регистрирующих приборов, некорректно собранной информацией о состоянии изучаемого явления. Этот способ используется также при объективно существующей неоднородности структуры и функционирования отдельных систем человеческого организма.
6. Кодировка данных – это унификация формы представления данных на бумажных или магнитных носителях.
7. Сортировка данных – это упорядочение данных по заданному признаку или совокупности их характеристик.
8. Преобразование данных – это изменение формы данных по заданному алгоритму или между различными типами 9. Сжатие и архивация данных – это уплотнение данных на носителях и организация их хранения, нередко связана с изменением их формы.
10. Защита данных – это приведение данных по специальному алгоритму к форме, которая недоступна для несанкционированного их использования (шифрование, или криптографическая обработка данных).
11. Транспортировка данных – это передача данных на расстояния с помощью механических или телекоммуникационных каналов связи.
Сбор данных – это накопление их в достаточной степени для того, чтобы принять адекватное решения или получить статистически значимый результат. Объем данных обычно задается заранее либо определяется анализом промежуточных результатов.
Нередко объем данных ограничен объективно существующими обстоятельствами, например, ограниченным количеством больных, поступивших на лечение с конкретным исследуемым заболеванием.
Сбор данных – очень важная составляющая часть обработки первичного материала. Особенно это касается тех случаев, когда имеют дело с измерением медико-биологических сигналов. Все эти измерения, как бы точны они не были, обязательно имеют некоторую степень погрешности. Это может быть связано с ограниченной точностью инструментов, которыми проводятся измерения – линейки, электронного прибора или других технических средств. Погрешность может быть обусловлена также и вариабельностью самого измеряемого объекта, например, колебаниями биологических параметров человека во время исследования (суточные биоритмы), отсутствием достаточной фиксации тела человека в момент антропометрических измерений, наводкой по электросетям во время снятия биопотенциалов (ЭКГ, электроэнцефалография).
Перечисленные выше погрешности имеют случайный характер. Их влияние на точность измерения может быть уменьшено, если увеличить количество измерений объекта исследования или увеличить продолжительность каждого измерения (это касается, в основном, электрических величин). Погрешности такого рода носят название случайных, или рандомизированных, ошибок.
Другой вид погрешностей возникает при неправильной работе аппаратуры, калибровке лабораторного оборудования (электронных приборов, весов, тонометров и др.), технологии приготовления химических растворов в биохимических лабораториях, ошибок, допущенных в расчетах. Конечные результаты подобных измерений оказываются во всех случаях либо завышенными, либо заниженными, т.е. всегда однозначно искаженными. Такого рода ошибки носят название систематических ошибок. Единственная возможность их избежать – это тщательно контролировать исправность медицинской аппаратуры, проводить регулярную поверку в специальных лабораториях, следить за правильностью выполнения диагностических и расчетных процедур, корректно выполнять эти расчеты.
1.3.2. Оценка эффективности измерения данных Для оценки эффективности методов измерения медикобиологических данных применяют ряд критериев, главными из которых являются:
Точность измерений – это соответствие результатов измерения истинному значению определяемой величины. Высокая точность измерения достигается при минимальных рандомизированных и систематических погрешностях.
Правильность измерений. Это качество измерения характеризует величину систематических погрешностей. Чем они меньше, тем более правильным оказываются измерения.
Рис.1.1. «Охота за мишенью. Связь между достоверностью (точностью) и сходимостью результатов, рандомизированными и систематическими ошибками исследований Сходимость измерений. Данное качество измерения характеризует величину случайных ошибок. Чем они меньше, тем лучше сходимость измерения. Этот критерий показывает, насколько близки друг к другу измерения, выполненные в одинаковых условиях, т.е в одной и той же лаборатории и на одном и том же приборе.
Воспроизводимость измерений. Этот критерий показывает, как близки между собою будут результаты измерений, выполненных в различных условиях, т.е. в различных лабораториях, на различных аппаратах и различными людьми.
На рис.1.1 представлено взаимоотношение систематических и рандомизированных ошибок, точности и сходимости измерений, условно обозначенное нами как «охота за мишенью». Как мы видим, точность измерений включает в себя в качестве обязательного критерия их сходимость. В то же время сходимые измерения из-за систематической ошибки могут оказаться неточными.
Данное обстоятельство нужно обязательно учитывать при анализе всех медико-биологических данных.
Величину расхождения между измерениями, выполненными в одних и тех же условиях, обозначают как среднее квадратическое, или стандартное, отклонение (). Оно определяется по формуле:
где ¦ (x1 x ) – сумма квадратов разностей каждого из измерения со средними величинами и, п — количество измерений.
Для обозначения средней величины серии измерений (одного или нескольких объектов) пользуются показателем x ±. В таких границах («значимых»), то есть от x до x +, будут располагаться 68,3% от всех проведенных измерений. Существуют более широкие границы значений – «зона предостережения» ( x ± 2 ), которая включает в себя 95,5% всех измерений, и «контрольные границы измерений» ( x ± 3 ), в пределах которых находятся 99,7% измерений.
Для того чтобы оценить вариабельность измерений внутри одной серии, то есть оценить сходимость результатов, прибегают к определению коэффициента вариации (KB) по следующей формуле:
где – стандартное отклонение, – значение измерения.
Чем меньше коэффициент вариации, тем выше качество измерений. В медико-биологических исследованиях обычно допустимы измерения, у которых коэффициент вариации не превышает 10%.
Для того чтобы охарактеризовать точность, с которой определена какая-либо средняя величина, используют показатель «стандартная погрешность», или «стандартная ошибка» (т). Он составляет где – стандартное отклонение, n – количество измерений. = Стандартная погрешность позволяет, кроме того, сопоставить результаты измерений, выполненных в различных лечебных учреждениях или произведенных различными методами исследования. Для этого нужно определить достоверность различия двух средних арифметических x A и xB. Выполняют это с помощью t – критерия Стьюдента. Критерий Стьюдента определяется по формуле где – среднее значение измерений, m – стандартная ошибка в сериях измерений А и B. Чем больше критерий Стьюдента, тем достовернее различие между изучаемыми сериями измерений.
В табл. 1.1 приведены максимально допустимые значения критерия Стьюдента для пятипроцентного риска ошибочных заключений, что вполне приемлемо в практической медицине.