WWW.DISS.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
(Авторефераты, диссертации, методички, учебные программы, монографии)

 

На правах рукописи

Исходжанов Тимур Равилевич

АВТОМАТИЧЕСКИЙ ПОИСК ОШИБОК

В КОМПЬЮТЕРНЫХ ПРОГРАММАХ

С ПРИМЕНЕНИЕМ ДИНАМИЧЕСКОГО АНАЛИЗА

Специальность 05.13.11

Математическое и программное обеспечение

вычислительных машин, комплексов и компьютерных сетей

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Москва — 2013

Работа выполнена на кафедре информатики федерального государственного автономного образовательного учреждения высшего профессионального образования «Московский физико-технический институт (государственный университет)»

Научный руководитель: член-корреспондент РАН, доктор физико-математических наук, профессор Петров Игорь Борисович

Официальные оппоненты: доктор физико-математических наук, профессор Петренко Александр Константинович.

Федеральное государственное бюджетное учреждение науки Институт системного программирования РАН, заведующий отделом Технологий программирования.

кандидат физико-математических наук Потапов Антон Павлович.

ООО «Параллелз Рисерч», старший инженер-программист.

Федеральное государственное бюджетное

Ведущая организация:

учреждение науки Научно-исследовательский институт системных исследований Российской академии наук (НИИСИ РАН)

Защита состоится 2013 г. в часов на заседании диссертационного совета Д 002.017.02 при Федеральном государственном бюджетном учреждении науки «Вычислительный центр им. А.А. Дородницына Российской академии наук», расположенном по адресу: 119333, г.Москва, улица Вавилова, 40.

С диссертацией можно ознакомиться в библиотеке ВЦ РАН.

Автореферат разослан 2013 г.

Ученый секретарь диссертационного совета Д 002.017.02, д.ф.-м.н., профессор Рязанов В.В.

Общая характеристика работы

Актуальность работы Компьютерные программы часто содержат ошибки. Ошибки в программном обеспечении могут приводить к разнообразным последствиям, в том числе к таким серьезным, как большие экономические потери и гибель людей; к неправильному или непредсказуемому поведению программ, замедлению их работы, аварийным завершениям исполнения, порче данных и т.п. Ошибки бывают детерминированные (воспроизводятся при одних и тех же начальных данных) и недетерминированные (приводят к различным последствиям от запуска к запуску).

«неопределенное поведение»

Особый интерес представляют ошибки типа undefined behavior), которые происходят при нарушении программистом (англ.

стандарта языка либо спецификаций используемых программных функций или библиотек. Примером такой ошибки является доступ к памяти за границами массива в программах на языках C/C++. Часто неопределенное поведение указывается в спецификации языка или интерфейса в целях ее упрощения и оптимизации, так как допускает большое количество различных корректных реализаций, из которых можно для каждого конкретного случая выбрать наиболее подходящую (например, наиболее эффективную). В случае нарушения спецификации, приводящего к возникновению неопределенного поведения, компилятор или библиотека вправе выполнять некорректные и неожиданные действия.

обычно они не имеют наблюОсобенностью таких ошибок является то, что иногда могут приводить к серьезным сбоям. При этом даемых последствий, но условия возникновения этих ошибок могут быть трудновоспроизводимыми, например, зависеть от версии компилятора, библиотеки или ОС, от частоты процессора, количества ядер или даже его температуры. Более того, многие такие ошибки приводят не ко мгновенным последствиям, а к порче данных, эффект от которой будет наблюдаться лишь через некоторое время, затрудняя понимание и обнаружение ошибки.

Многие такие ошибки не удается легко обнаружить при использовании обычных средств тестирования, даже при многократном запуске тестов. Проблема становится всё более острой, учитывая постоянный рост сложности и объемов исходных кодов современных программ, а также количества задач, которые решаются с помощью компьютеров. Для эффективного нахождения ошибок в крупных программных проектах требуется использовать автоматические инструменты. В данной работе такие инструменты будут называться ческие. Статический анализ ошибок выполняется над исходным кодом программы без необходимости запускать ее. В частности, к статическому анализу относится формальное доказательство корректности кода программы. Иногда статический анализ ошибок встроен непосредственно в компилятор и приводит к предупреждениям или даже сообщениям об ошибках, если корректность кода сомнительна. Динамический анализ заключается в запуске программы или отдельных ее частей в рамках набора тестов с наблюдением и анализом ее поведения. По сути, при использовании анализаторов происходит ужесточение правил языка программирования, когда часть «неопределенных поведений»

имеет определенный результат, такой как ошибка компиляции, печать сообщения об ошибке или аварийное завершение работы программы. Следует отметить, что ни одно из этих поведений не противоречит стандарту языка.

К очевидным недостаткам динамического анализа относится то, что ошибки возможно находить только в том коде, который исполняется на наборе тестов («покрыт» тестами). Впрочем, если код крупного программного проекта недостаточное покрыт тестами, то это само по себе является проблемой. К недостаткам статического анализа относится его значительная вычислительная сложность (нередко — более чем линейно зависящая от размера кода) и обычно низкая точность. Часто поиск нетривиальных ошибок статическим анализом с достаточной точностью возможен только для отдельных изолированных модулей программы и требует особой организации ее исходного кода.



В рамках данной работы был выбран динамический анализ, так как стояла практическая задача нахождения ошибок в существующей большой базе кода (более 100 млн строк кода на языке C++), существенное редактирование и реорганизация которой за разумное время представлялись затруднительными.

Существует множество различных алгоритмов, детекторов и подходов к динамическому анализу компьютерных программ, однако в ходе их исследования было обнаружено, что они зачастую обладают недостаточной эффективностью, функциональностью и точностью.

Цель диссертационной работы — разработка новых методов динамического тестирования программ, позволяющих достичь большей эффективности и точности при поиске ошибок в крупных программных проектах, чем у известных.

Для достижения цели работы были поставлены следующие задачи:

1. Изучение и развитие существующих средств поиска ошибок работы с памятью и «состояний гонок» (data race).

2. Разработка нового алгоритма поиска ошибок типа «состояние гонки» и динамического детектора таких ошибок, применимого для тестирования кода с нестандартными средствами синхронизации. Сравнение эффективности и точности полученного детектора с аналогами.

3. Исследование методов компиляторного, статического и динамического инструментирования кода, а также развитие средств инструментирования для задач автоматического поиска ошибок.

(Инструментирование — модификация или внедрение кода в программу, например с целью отслеживания происходящих в ней событий.) 4. Создание автоматической системы тестирования крупного программного проекта с применением модернизированных и новых разработанных детекторов ошибок.

Научная новизна. Благодаря применению динамических аннотаций удалось упростить задачу нахождения ошибок типа «состояние гонки» (которая является NP-трудной), что позволило применить уточненную модель одновременности событий в многопоточных программах. Используя эту модель, был разработан новый алгоритм поиска таких ошибок, обладающий большей точностью, чем аналоги.

Разработан новый подход к инструментированию программ с целью поиска ошибок, позволяющий достичь большей функциональности и эффективности, чем ранее известные.

Практическая значимость заключается в увеличении эффективности и точности инструментальных средств поиска ошибок, доступных разработчикам программных продуктов.

Разработан и реализован ThreadSanitizer, новый детектор ошибок типа «состояние гонки». Благодаря использованию ThreadSanitizer для тестирования браузера Chromium, а также серверного программного обеспечения компании Google было обнаружено более тысячи ранее неизвестных ошибок, в том числе десятки критических.

Предложен новый подход к инструментированию, позволяющий разрабатывать более эффективные и точные детекторы.

Рассматриваются вопросы практического применения детекторов для тестирования крупных программных проектов. Были доработаны известные детекторы ошибок работы с памятью (в частности, Valgrind/Memcheck).

Основными методами исследования, используемыми в работе, являются методы верификации программного обеспечения, системного программирования, теории алгоритмов и сложности, аппарат теории множеств и теории порядка. Для оценки эффективности предлагаемых решений применяются тесты производительности.

На защиту выносятся следующие положения:

Разработан новый алгоритм поиска ошибок типа «состояние гонки»

(data race) с применением уточненной модели одновременности событий в многопоточных программах. Алгоритм был реализован в новом детекторе состояний гонок для программ на языках C/C++, позволяющем достичь большей точности нахождения ошибок, чем у аналогов.

Разработан и реализован новый подход к инструментированию кода программ, основанный на комбинации компиляторной и динамической инструментации.

Создана система регулярного автоматического тестирования программного обеспечения, использующая различные динамические детекторы ошибок, доработанные на основании их анализа. Система внедрена для тестирования веб-браузера Chromium.

Программные реализации, описываемые в данной работе, доступны в виде открытых исходных кодов.

Апробация работы. На разных этапах работы основные результаты по теме диссертации были представлены на следующих конференциях и семинарах:

1. Workshop on Binary Instrumentation and Applications, WBIA’ (Нью-Йорк, 2009).

2. 52-ая научная конференция МФТИ (Долгопрудный, 2009).

3. Runtime Verification, RV 2011 (Сан-Франциско, 2011).

4. Семинар Института системного программирования РАН (Москва, 2013).

5. Научные семинары кафедры информатики МФТИ (Москва, Долгопрудный, 2010–2013).

По теме диссертации автором опубликовано 5 работ (из них 3 в изданиях из перечня ВАК).

Разработанные детекторы и подходы были успешно использованы для тестирования браузера с открытым исходным кодом Chromium, а также серверного программного обеспечения Google.

Структура и объем диссертации. Диссертационная работа состоит из введения, четырех глав, заключения, списка использованных источников и одного приложения. Список использованных источников включает 67 наименований. Общий объем работы составляет 133 страницы. Объем приложений составляет 16 страниц.

Во введении обоснована актуальность диссертационной работы, сформулирована цель и аргументирована научная новизна исследований, показана практическая и теоретическая значимость полученных результатов, представлены выносимые на защиту результаты и положения.

В первой главе дан обзор известных методов и подходов к поиску ошибок.

Описываются основные сценарии тестирования, с которыми применяются детекторы ошибок: ручное, автоматизированное, а также рандомизированное.

Для дальнейшего анализа точности детекторов определяются понятия первого рода (англ. false positive, ложное срабатывание) и ошибки второго рода (англ. false negative, пропуск ошибки), а также обсуждаются проблемы, к которым может приводить неточность детектора, и способы борьбы с ними.

Инструментированием инструментацией или называется модификация или внедрение кода в программу, например с целью отслеживания происходящих в ней событий для дальнейшей обработки алгоритмом поиска ошибок.

Рассматриваются основные подходы к инструментированию программ: динамическое (во время работы программы), статическое (перед запуском программы) и компиляторное (во время компиляции).

Динамическое инструментирование удобно тем, что его можно применять даже к программам, исходный код и отладочная информация которых недоступна; а также к самомодифицирующимся программам и программам, генерирующим исполняемый код на лету (JIT). К недостаткам этого подхода можно отнести ограниченные возможности по внедрению дополнительного кода, как например: невозможность изменения расположения локальных переменных функций на стеке, чувствительность алгоритмов анализа к оптимизациям тестируемого кода, а также низкую производительность, особенно в начале работы программы.

Для корректной работы систем, использующих динамическое инструментирование, необходимо, чтобы все косвенные вызовы в программе выполнялись через специальный диспетчер вызовов системы инструментирования. В общем случае для этого требуется транслировать весь исполняемый код, что влечет за собой дополнительные затраты порядка 1000 инструкций системы инструментирования на одну инструкцию тестируемой программы. Эти затраты становятся существенными при тестировании крупных программных проектов.

Статическое инструментирование позволяет минимизировать затраты на инструментацию во время исполнения, выполняя ее до запуска. Однако его возможности еще более ограничены: в частности, оно не может применяться к самомодифицирующемуся и динамически генерируемому коду, а также в общем случае требует наличия отладочной информации программы.

Компиляторное инструментирование выполняется компилятором.

Благодаря работе на уровне исходного кода или его промежуточного представления такой подход позволяет изменять расположение глобальных переменных, локальных переменных в стековой памяти, а также достигать бльшей произвоо дительности. К недостаткам можно отнести необходимость наличия исходного кода программы, а также невозможность инструментирования самомодифицирующегося и динамически генерируемого кода.

Помимо инструментирования, для поиска ошибок чаще всего нужно также применять специальную library), добавляющую в программу новые функции, а также заменяющую реализации существующих функций. Это позволяет внедренному инструментацией коду, а также оригинальному коду программы нужным образом взаимодействовать с алгоритмом детектора.

Многим алгоритмам поиска ошибок требуется хранить некоторое вспомогательное «состояние» для каждой ячейки или блока памяти. Совокупность состояний переменных называют тенью, она выделяется и обрабатывается библиотекой времени исполпросто нения и самим анализатором. Описываются основные подходы к организации теневой памяти: в заголовках блоков динамической памяти, в хэш-таблице;

линейное и двухуровневое линейное отображения адресного пространства.

Затем рассматривается несколько распространенных типов ошибок в программах на языках C/C++ и устройство детекторов таких ошибок. Приводится пример программы с ошибкой типа «переполнение знаковой целочисленной переменной», которая корректно работает при компиляции в отладочном режиме, но приводит к неверному результату и завершается аварийно при использовании оптимизаций.

Описывается детектор примеры ошибок следующих типов: утечка динамической памяти, повторное освобождение блока динамической памяти, выход за границы динамической памяти, доступ к освобожденной памяти, использование неинициализированных данных — и описываются их возможные последствия. Рассматриваются алгоритмы, которыми детектор Memcheck находит такие ошибки. Из-за сложности применяемых алгоритмов и использования динамического инструментирования Memcheck существенно замедляет работу тестируемых программ — в среднем, в 20–30 раз для однопоточных программ и еще больше для многопоточных.

Следует отметить, что в детекторе Memcheck разделяются понятия утечМножеством начальной достижики памяти и возможной утечки памяти.

мости (в заданный момент времени, например в конце работы программы) назовем совокупность регистров общего назначения всех работающих потоков, их стеков, а также глобальной памяти.

на начало которого есть указатель во множестве начальной достижимости такой, на один из байтов которого есть указатель во множестве начальной достижимости или в другом возможно достижимом блоке. Утечками памяти обычно считаются те блоки, которые не являются возможно достижимыми, а возможными утечками считают те блоки, которые не являются достижимыми.

В зависимости от специфики конкретного программного проекта бывает и так, что требуется освобождать все выделенные блоки динамической памяти, тогда даже блоки памяти, достижимые в конце работы программы, считаются утечками.

Описываются применяемые в детекторе Memcheck suppressions), используя которые можно избавляться от ложных срабаангл.

тываний детектора, а также автоматически игнорировать повторные сообщения об известных ошибках.

Детектор AddressSanitizer не находит ошибок типа «использование неинициализированных данных», зато благодаря применению компиляторного инструментирования и более простому алгоритму поиска ошибок работы с памятью он работает значительно эффективнее Memcheck. В среднем тестируемые программы замедляются примерно вдвое. Осуществление инструментации в компиляторе позволяет также находить ошибки работы со стековой памятью и глобальными переменными. При этом детектору AddressSanitizer удается находить ошибки без ложных срабатываний. Однако из-за ограничений компиляторного инструментирования этот детектор не может находить некорректные доступы к памяти, происходящие в системных и сторонних библиотеках.

Рассматриваются основные подходы к поиску ошибок типа гонки», возникающие в многопоточных программах.

Состоянием гонки (англ. data race) называется ситуация, Определение.

когда два или более потока исполнения программы могут одновременно осуществить доступ к одной области памяти (например, переменной) и как минимум один из этих доступов является записью.

Состояния гонок — одни из самых опасных и труднонаходимых при тестировании и отладке ошибок. При этом переход развития аппаратного обеспечения от роста частот к росту количества ядер и процессоров делает задачу эффективного поиска таких ошибок всё более актуальной. Задача поиска состояний гонок является NP-трудной, однако существуют приближенные алгоритмы ее решения. Динамические детекторы без особого труда могут проверить все условия в определении состояния гонки, за исключением одновременности событий. Таким образом, именно моделью одновременности событий в основном отличаются алгоритмы поиска таких ошибок.

Алгоритм Lockset ставит каждой разделяемой переменной в соответствие множество блокировок ( ), которые были захвачены при всех наблюдавшихся доступах к. При каждом новом доступе к алгоритм записывает в ( ) пересечение старого значения ( ) и множества захваченных текущим потоком блокировок. Если это множество становится пустым, то это значит, что нет ни одной блокировки, которая бы синхронизировала все доступы к. С точки зрения алгоритма Lockset это значит, что возможны одновременные доступы к переменной из нескольких потоков, то есть состояние гонки.

Алгоритм Lockset не пропускает состояний гонок, которые могут возникнуть в исполняемом при тестировании коде (отсутствие ошибок второго рода), а также очень эффективно реализуется в детекторах; однако существует множество примеров ложных срабатываний, в особенности при использовании таких средств синхронизации, как семафоры и очереди сообщений. Другими словами, модель одновременности, применяемая в алгоритме Lockset, неточна: он хорошо подходит только для тестирования подмножества многопоточных программ, в которых вся синхронизация осуществляется посредством блокировок.

Другой распространенный подход к поиску состояний гонок — установление между событиями в программе отношения частичного порядка «»

(«предшествует»). Пользуясь гипотезой о том, что если при одном запуске программы событие предшествовало, то они не могут произойти одновременно, можно считать, что события и могут происходить одновременно тогда и только тогда, когда ни одно из них не предшествует другому. Использующий эту гипотезу алгоритм (далее — алгоритм Happensbefore) проверяет доступы к каждой области памяти и, если ему не удается установить отношение предшествования между ними, сообщает о наличии состояния гонки. Используя такой алгоритм, удается находить состояния гонок без ложных срабатываний при условии, что детектор наблюдает все события синхронизации в программе. Однако применение такой гипотезы приводит к большому количеству пропускаемых ошибок в программах, использующих для синхронизации блокировки, то есть такая модель одновременности событий также неточна. Кроме того, вычисление отношения предшествования требует бльших временных затрат, чем у алгоритма Lockset.

гибридные алгоритмы поиска состояний гонок, которые Существуют и пытаются совместить Lockset и Happens-before. Обычно они отличаются своей сложностью, при этом, вместо теоретического обоснования, они строятся эмпирически. Так как задача NP-трудна, эти алгоритмы не могут быть точными, а их сложность затрудняет понимание отчетов об ошибках. При изучении статей по гибридным алгоритмам не было обнаружено решений, позволяющих эффективно бороться с ложными срабатываниями, что требуется для тестирования крупных программных проектов.

Во второй главе описывается алгоритм поиска состояний гонок, разработанный для детектора ThreadSanitizer.

Алгоритм может работать в двух режимах: гибридном и Happens-before.

Вместо решения NP-трудной задачи в общем случае при использовании гибридного алгоритма в код тестируемой программы может потребоваться добавить дартные средства синхронизации, применяемые в тестируемой программе, удается более точно устанавливать отношение предшествования между событиями, чем это делает алгоритм Happens-before. Аннотации можно также применять для создания вспомогательных событий уведомления и ожидания в коде, что позволяет детектору более точно обрабатывать такие паттерны многопоточного программирования, как очереди сообщений и подсчет ссылок.

Используя инструментацию, детектор наблюдает процесс работы исследусинхронизации и достуемой программы в виде последовательности событий пов к памяти. События доступов к памяти бывают двух типов: чтение и запись.

События синхронизации бывают двух основных типов: уведомление-ожидание (семафоры, POSIX condvar и подобные примитивы) и работа с блокировками (захват/освобождение).

Введем несколько вспомогательных определений для описания алгоритма.

Определение.

наблюдалось до и выполнено хотя бы одно из следующих утверждений:

и были выполнены одним и тем же потоком исполнения;

является уведомлением (англ. signal) некоторого примитива (семафора, элемента очереди сообщений и т.п.), при этом является ожиданием (англ. wait) уведомления на том же примитиве;

Существуют такие события и, что выполняется Следует отметить, что в отличие от алгоритма Happens-before, в гибридном алгоритме ThreadSanitizer не устанавливается отношения предшествования между событиями над блокировками; вместо этого применяются множества блокировок подобно алгоритму Lockset.

Непрерывную подпоследовательность событий, произошедОпределение.

ших в одном потоке, среди которых нет событий синхронизации, будем называть сегментом.

Так как все события в сегменте произошли в одном потоке, они не могут участвовать в состоянии гонки друг с другом.

Естественным образом определяется отношение предшествования между сегментами: сегмент, если для любых событий и выполняется.

Пусть сегмент произошел в потоке. Из определения сегмента естественным образом следует, что во время выполнения всех его событий потоком захвачена (locked) одна и та же пара наборов блокировок для записи () (writer-lockset) и для чтения () (reader-lockset).

Определение. Пусть — операция доступа к памяти, выполненная внутри сегмента. Определим эффективный набор взятых для операции блокировок как:

Определение. Будем считать, что события доступа к памяти и могут произойти одновременно, если они не предшествуют друг другу (, ) и пересечение их эффективных наборов взятых блокировок пусто ( = ).

Напомним, что состоянием гонки называется такая ситуация, когда два или более потока исполнения программы могут одновременно осуществить доступ к одной области памяти и как минимум один из этих доступов является записью.

Следует отметить, что такое определение одновременности учитывает и блокировки, и предшествование событий. Как показывается в приложении, такое определение более точно, чем определения, применяемые в алгоритмах Lockset и Happens-before, Далее также пригодится следующее определение:

Определение.

неупорядоченных сегментов (англ. segment set), если для любых и из этого набора выполняется.

Следует заметить, что по определению в наборе неупорядоченных сегментов не может быть нескольких сегментов из одного и того же потока.

При обработке каждого события синхронизации в текущем потоке начинается новый сегмент и для него вычисляются текущие наборы блокировок и. Также производятся вычисления, необходимые для эффективной проверки отношения предшествования между событиями.

Состояние области памяти описывается в ячейке теневой памяти двумя наборами сегментов: и, которые соответствуют ранее наблюдавшимся операциям записи и чтения в эту область памяти. байта памяти — это набор неупорядоченных сегментов, в которых в него происходили запись и чтение, а его — это набор неупорядоченных сегментов, в которых из него происходило чтение, но не запись. Начальные и для каждого байта памяти пусты. Далее каждый доступ к памяти обрабатывается алгоритмом 1.

Если в процессе обработки обнаруживается, что среди двух наборов неупорядоченных сегментов некоторого байта по адресу есть пара сегАлгоритм 1 Обработка доступа к памяти по адресу потоком.

1: function Handle-Memory-Access(Addr, IsWrite, ) 2: (, ) Get-State-For-Address(Addr) 3: Seg Get-Current-Segment( ) 9: // Обработка чтения изменяет только.

Set-State-For-Address(, 12: Check-If-Race(, ментов, хотя бы один из которых соответствует записи, а пересечение их эффективных наборов взятых блокировок пусто, то это значит, что имеет место состояние гонки (см. алгоритм 2).

Алгоритм 2 Алгоритм проверки наличия состояния гонки 1: function Check-If-Race(, ) 2: // Проверка наличия состояния гонки.

3: Segment-Set-Size( ) 4: // Перебор сегментов, в которых была запись.

7: 1 Get-Writer-Lock-Set(1 ) 9: // Проверка того, что не было одновременных записей.

13:

14:

15:

16: // Проверка одновременности пар чтение-запись.

17: Get-Reader-Lock-Set() Get-Writer-Lock-Set() 18:

19:

20:

При использовании алгоритма, вычисляющего отношение предшествования за ( ), алгоритм 1 имеет сложность в худшем случае ( 2 ( + )) (где — максимальное количество сегментов в наборе, — количество уникальных потоков за время жизни программы, а — максимальное количество одновременно захваченных потоком блокировок). При ограничении максимального количества сегментов в наборе, а также благодаря программным оптимизациям удается сделать сложность обработки доступов в среднем ( ).

При использовании алгоритма вычисления отношения предшествования, имеющего сложность (1), удается достичь сложности в худшем случае ( 2 ) и (1) в среднем. Однако на практике ускорения работы детектора от оптимизации процедуры вычисления отношения предшествования не наблюдалось.

Следует отметить важное свойство алгоритма ThreadSanitizer: он сводится к алгоритму Happens-before, если устанавливать отношение предшествования между событиями над блокировками, как это сделано в классическом алгоритме. При работе в гибридном режиме отношение предшествования устанавливается между событиями из разных потоков реже, чем в алгоритме Happensbefore, благодаря чему уменьшается количество пропускаемых ошибок, а также уменьшаются накладные расходы на вычисление отношения предшествования.

Алгоритм ThreadSanitizer был разработан таким образом, чтобы его отчеты о найденных ошибках были понятны обычным разработчикам. Это потребовало как тщательного анализа типичных ошибок и примеров корректного многопоточного кода, так и специальной организации данных алгоритма, чтобы отчеты были достаточно информативными. В частности, в отличие от многих других детекторов состояний гонок, ThreadSanitizer печатает стеки вызовов stack traces), соответствующие всем доступам к памяти, участвующим (англ.

в гонке, а не только последнему. Также при печати сообщений об ошибках в любом из двух режимов детектора сообщается информация о взятых каждым потоком блокировках, что не позволяет делать классический алгоритм Happensbefore.

Далее описывается организация теневой памяти, а также приемы, благодаря которым удалось эффективно реализовать алгоритм в детекторе, как например применение упрощенных векторных часов для вычисления отношения предшествования и кэширование результатов часто повторяющихся бинарных операций.

Рассматриваются основные функциональные отличия гибридного алгоритма ThreadSanitizer от алгоритмов Lockset и Happens-before, а также сравнивается их работа на типичных конфигурациях взаимодействующих потоков (в приложении).

ляют детектору корректно обрабатывать нестандартные средства синхронизации, а также избавиться от ложных срабатываний гибридного алгоритма, при этом находя больше ошибок, чем алгоритм Happens-before. Типичные примеры многопоточного кода, в который необходимо вносить динамические аннотации, приведены в приложении.

Рассматриваются способы обработки стандартных средств синхронизации, таких как POSIX Threads, а также синхронизации с применением низкоуровневых атомарных инструкций. Приводятся рекомендации по применению детектора для поиска ошибок в программах, в том числе порядок выбора режимов работы и внесения в код аннотаций. Рассматривается трудоемкость и целесообразность внесения аннотаций.

Далее приводятся данные экспериментальной оценки производительности двух версий детектора ThreadSanitizer, использующих динамическое и компиляторное инструментирование. Показывается, что при использовании системы динамического инструментирования Valgrind скорость работы сравнима с другими детекторами, использующими эту систему (замедление на тестах Chromium в 20–30 раз), а при использовании компиляторного инструментирования производительность ThreadSanitizer существенно превосходит аналоги (замедление на тестах Chromium в 2–3 раза).

Благодаря использованию детектора ThreadSanitizer для тестирования браузера Chromium и серверного программного обеспечения Google удалось найти более тысячи ошибок типа «состояние гонки», десятки из которых были признаны критически опасными.

В третьей главе рассматривается новый подход к инструментированию — комбинация компиляторного инструментирования тестируемой программы с динамическим инструментированием сторонних и системных библиотек, а также сгенерированного и самомодифицирующегося кода. Это позволяет достичь бльшей производительности, чем при применении только динамичео ского инструментирования, при этом получая бльшую функциональность, чем у каждого из этих подходов по отдельности.

В работе показывается практическая польза комбинированного инструментирования на примере детекторов DRASan (на базе AddressSanitizer) и MSanDR (на базе MemorySanitizer). Описывается, что в зависимости от специфики детектора можно применять комбинированное инструментирование как для нахождения ошибок в бльшем объеме кода, чем при применении только компиляторного инструментирования (уменьшение количества ошибок второго рода), так и для уменьшения количества ошибок первого рода, если алгоритму детектора для корректной работы требуется наблюдение событий во всей программе.

Исследуется производительность систем инструментирования Valgrind, PIN и DynamoRIO в условиях, специфичных для комбинированного инструментирования — когда внедрение дополнительного кода требуется только для отдельных динамических библиотек. Показывается, что при тестировании крупных программ из-за неэффективности этих систем может происходить замедление в 50–700 раз. Это гораздо больше, чем среднее замедление от десятков процентов до 4 раз на тестах SPEC CPU2006, которые обычно используются авторами систем инструментирования для оценки производительности.

Производится анализ замедления DynamoRIO, самой быстрой из протестированных систем инструментирования, и описываются выполненные для ее дальнейшего ускорения оптимизации. В частности, показывается, что для частичного динамического инструментирования (и, как следствие, для комбинированного) оказывается полезным указывать список модулей программы, не требующих внедрения дополнительного кода, что позволяет сократить накладные расходы на транслирование кода в 2,5–3,5 раза. В результате предложенных оптимизаций удается достичь четырехкратного ускорения системы DynamoRIO на тестах производительности.

Описывается новый архитектурный подход к динамическому инструментированию. Идея подхода заключается в том, чтобы вообще не транслировать динамически те модули программы, которые уже были инструментированы компилятором. При использовании комбинированного инструментирования можно предполагать, что компиляторная инструментация выполнена таким образом, который позволяет избавиться от необходимости транслировать весь код. Например, при компиляции косвенных вызовов внедряются необходимые вызовы диспетчера переходов динамической системы инструментирования.

Показывается, что благодаря использованию такого подхода удается ускорить короткие тесты больших программ более чем в 10 раз по сравнению с первоначальной версией DynamoRIO.

В четвертой главе описывается практическое применение динамических детекторов для регулярного автоматического тестирования браузера Chromium. Благодаря использованию этих детекторов за четыре года удалось обнаружить более 2500 ошибок, в том числе десятки критических и сотни опасных. Часть ошибок была найдена в используемых проектом сторонних и системных библиотеках. Найти столько ошибок вручную в проекте, размер исходного кода которого превышает 500 МБ, было бы весьма затруднительно и потребовало бы очень много трудозатрат.

Учитывая огромный размер кода проекта Chromium, а также его разнообразие, можно с достаточной уверенностью утверждать, что предложенный подход к тестированию проекта, а также внесенные в детекторы доработки подойдут для тестирования большого количества других проектов меньшего размера.

Рассматривается организация системы регулярного тестирования Chromium, состоящая из координирующих узлов и тестирующих компьютеров, а также типовые сценарии работы с ней. Описывается роль разработчиковшерифов, которые по очереди следят за статусом тестирующей системы и при необходимости исправляют ошибки, вносимые в репозиторий проекта.

Описываются изменения, которые потребовалось внести в детекторы, чтобы добиться эффективной работы в рамках тестирующей системы. Для всех детекторов, у которых бывают ложные срабатывания, была добавлена поддержка правил подавления сообщений об ошибках, подобных применяемым в Memcheck. Были разработаны автоматические генераторы правил подавления и утилита, позволяющая шерифам проверять работоспособность новых написанных правил подавления без необходимости перезапускать тесты. Это позволило упростить и ускорить процесс работы шерифов.

Рассматриваются проблемы, возникшие при переходе от запуска тестов на одном тестирующем компьютере к параллельному запуску на тестирующих компьютеров, в частности дублирование похожих сообщений об ошибках и увеличение частоты нестабильных от запуска к запуску сообщений об ошибках.

Сообщения об ошибках обрабатываются таким образом, что из них удаляется лишняя информация, которая может зависеть от условий конкретного запуска (например, адреса переменных), а затем из них удаляются дубликаты. Если какое-то сообщение об ошибке ранее не наблюдалось, то авторам последних изменений в коде, которые могли внести эту ошибку, отправляется уведомление.

Применение детекторов на таких крупных программных проектах, как Chromium, порой приводит к тому, что в самих детекторах обнаруживаются ошибки или недочеты. Демонстрируется неудобство стандартных типов правил подавления сообщений об ошибках детектора Memcheck при масштабном тестировании программ, работающих на разных ОС, а также при использовании различных компиляторов; вместо них предлагаются более простые и гибкие.

Показывается, что применение детекторов утечек памяти при тестировании больших 32-битных программ связано со значительным количеством пропусков ошибок, если возможные утечки памяти не считаются ошибками.

Большое количество ошибок второго рода чревато также трудностью сопоставления новых отчетов об ошибках с недавними изменениями в репозитории проекта.

Показывается, что детектор Memcheck отличается большим количеством ложных срабатываний при поиске возможных утечек в коде на языке C++.

Исправляются причины ложных сообщений о возможных утечках на объектах типов std::string, std::vector и других, память для которых выделена оператором new[].

Также в результате доработки алгоритма поиска утечек памяти удалось ускорить тестирование крупных приложений с применением детектора Memcheck на 10 %.

В заключении сформулированы основные результаты диссертационной работы. Результаты и положения, выносимые на защиту, совпадают.

В приложении подробно иллюстрируется работа предложенного алгоритма поиска ошибок типа «состояние гонки». Результаты работы алгоритма сопоставляются с результатами работы основных ранее известных алгоритмов.

Приводятся примеры наиболее распространенных ошибок этого типа, найденных при использовании детектора ThreadSanitizer. Рассматриваются основные причины ложных срабатываний алгоритма ThreadSanitizer и описывается как их удаётся избежать при использовании динамических аннотаций.

Список публикаций автора по теме диссертации 1. Serebryany K., Iskhodzhanov T. ThreadSanitizer: data race detection in practice // ACM International Conference Proceeding Series — 2009 — P. 62–71.

2. Serebryany K., Potapenko A., Iskhodzhanov T., and Vyukov D.

Dynamic race detection with LLVM compiler // Runtime Verification — Lecture Notes in Computer Science. V. 7186 — 2012 — P. 110–114.

3. Iskhodzhanov T., Kleckner R., Stepanov E. Combining compiletime and run-time instrumentation for testing tools // Programmnye produkty i sistemy — 2013 — no. 3 (103) — P. 224–231.

4. Исходжанов Т. Р., Серебряный К. С. Эффективный динамический анализ корректности синхронизации многопоточного кода с применением гибридного алгоритма // Труды 52–й научной конференции МФТИ. Часть VII.

Управление и прикладная математика. Т. 3 — М.–Долгопрудный, 2009 — 5. Пименов М. Н., Исходжанов Т. Р., Вьюков Д. С. Определение состояний гонки в языке программирования Go // Труды 54–й научной конференции МФТИ. Управление и прикладная математика. Т. 2. — М.– Долгопрудный–Жуковский, 2011, — С. 67–68.

(Полужирным шрифтом отмечены публикации в журналах из перечня ВАК) Личный вклад соискателя в работах заключается в следующем:

[1,2,4,5] — разработка и реализация алгоритма поиска состояний гонок на основании анализа распространенных состояний гонок;

[1] — анализ производительности детектора;

[3] — исследование возможностей комбинированного инструментирования и разработка инструментов тестирования, основанных на этом подходе; анализ производительности систем инструментирования и разработка предложений по повышению производительности системы инструментирования DynamoRIO.





Похожие работы:

«КОЛЬЦОВА Анна Михайловна ПОЛУЧЕНИЕ ПОСТОЯННЫХ ЛИНИЙ ЭМБРИОНАЛЬНЫХ СТВОЛОВЫХ КЛЕТОК ЧЕЛОВЕКА И СРАВНЕНИЕ ИХ ХАРАКТЕРИСТИК ПРИ КУЛЬТИВИРОВАНИИ В РАЗНЫХ СИСТЕМАХ 03.03.04.– Клеточная биология, цитология, гистология АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата биологических наук Санкт-Петербург – 2012 Работа выполнена в Федеральном государственном бюджетном учреждении науки Институт цитологии РАН, Санкт-Петербург Научный руководитель : доктор биологических наук...»

«МАКСАЕВА Анна Эдуардовна СОВЕРШЕНСТВОВАНИЕ ОБУЧЕНИЯ ИНОСТРАННОМУ ЯЗЫКУ В ВУЗАХ НА ОСНОВЕ СОЦИОКУЛЬТУРНОГО ОПЫТА Специальность 13.00.08 – Теория и методика профессионального образования Автореферат диссертации на соискание ученой степени кандидата педагогических наук Москва – 2012 Диссертация выполнена в Федеральном государственном казнном военном образовательном учреждении высшего профессионального образования Военный университет Министерства обороны Российской Федерации...»

«! #!$%#&#'!%()*$+,+!!!!!!!!!!! ! ! -./01!2##3! ! ! 4567/7800!097:-.;077>5:?10!@=:.A/50B!! C5D7=.277A!A!@2/7A0B6! :52=@C/010!=.1024.!.!C.D5!802! ! ! ! ! ! ! 2$FG+#HIJ*,KI!LMNOONPM!Q!8F*+JR*%S#K+)#! ! ! ! !.&K*%FRF%#K! 3+,,F%K#G++!J#!,*+,)#J+F!(TUJ*V!,KF$FJ+! )#J3+3#K#!KF'J+TF,)+'!J#()! ! ! ! ! ! ! 2#J)K!Q!=FKF%W(%X!Q!LOYL! ! :#W*K#! &Z$*HJFJ#! &! 9F3F%#HIJ*S! X*,(3#%,K&FJJ*S! W[3\FKJ*S! *W%#]*&#KFHIJ*S! (T%F\3FJ++! &Z,^FX*! $%*RF,,+*J#HIJ*X*! *W%#]*&#J+_!...»

«Толкунова Наталья Александровна СИСТЕМАТИЗАЦИЯ РОССИЙСКОГО ЗАКОНОДАТЕЛЬСТВА В СФЕРЕ СОЦИАЛЬНОЙ ЗАЩИТЫ НАСЕЛЕНИЯ Специальность: 12.00.01 – теория и история права и государства; история учений о праве и государстве АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата юридических наук Нижний Новгород – 2011 Работа выполнена на кафедре правовых дисциплин Федерального государственного бюджетного образовательного учреждения высшего профессионального образования Мордовский...»

«Новик Алексей Александрович ИССЛЕДОВАНИЕ ПРОЦЕССА УЛЬТРАЗВУКОВОГО ДИСПЕРГИРОВАНИЯ КЕРАМИЧЕСКИХ МАТЕРИАЛОВ В ЖИДКИХ СРЕДАХ Специальность: 05.09.10 – Электротехнология АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Санкт-Петербург – 2013 2 Работа выполнена в ФГБОУ ВПО Санкт-Петербургский государственный электротехнический университет ЛЭТИ им. В.И.Ульянова (Ленина) на кафедре электротехнологической и преобразовательной техники. Научный...»

«БЫСТРИЦКАЯ Елена Витальевна Система организации самостоятельной учебной деятельности студентов и ее моделирование по психолого-педагогическим дисциплинам подготовки педагога по физической культуре 13.00.08 – Теория и методика профессионального образования Автореферат диссертации на соискание ученой степени доктора педагогических наук Москва - 2013 2 Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования...»

«Атясова Марина Львовна ПРЕДОПЕРАЦИОННАЯ ПОДГОТОВКА И ОПЕРАТИВНОЕ ЛЕЧЕНИЕ ГЛУБОКИХ ОЖОГОВ У ЛИЦ ПОЖИЛОГО И СТАРЧЕСКОГО ВОЗРАСТА 14.01.15 – травматология и ортопедия АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата медицинских наук Нижний Новгород – 2012 Диссертация выполнена на базе отдела термической травмы федерального государственного бюджетного учреждения Нижегородский научно-исследовательский институт травматологии и ортопедии Министерства здравоохранения и...»

«МАТВЕЕВА МАРИЯ ВИТАЛЬЕВНА МЕТОДОЛОГИЯ ЦЕЛЕВОЙ ФОКУСИРОВКИ ИНВЕСТИЦИОННО-СТРОИТЕЛЬНОЙ ДЕЯТЕЛЬНОСТИ В НОВОЙ МОДЕЛИ ЭКОНОМИЧЕСКОГО РОСТА Специальность 08.00.05 – Экономика и управление народным хозяйством (экономика, организация и управление предприятиями, отраслями, комплексами (строительство)) АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора экономических наук Иркутск – 2013 Диссертационная работа выполнена на кафедре Экспертиза и управление недвижимостью ФГБОУ ВПО...»

«ШВАРЦ ПАВЕЛ ГЕННАДЬЕВИЧ НЕЙРОГЕННЫЕ НАРУШЕНИЯ МОЧЕИСПУСКАНИЯ У БОЛЬНЫХ С ОСТРЫМИ И ХРОНИЧЕСКИМИ СОСУДИСТЫМИ ЗАБОЛЕВАНИЯМИ ГОЛОВНОГО МОЗГА (КЛИНИКА, ДИАГНОСТИКА И ЛЕЧЕНИЕ) 14.01.11 – Нервные болезни 14.01.23 – Урология АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора медицинских наук Москва 2013 Работа выполнена в Федеральном государственном бюджетном учреждении Научный центр неврологии Российской академии медицинских наук. Научные консультанты: доктор медицинских...»

«Мишин Валерий Юрьевич МЕТОДЫ ОБРАБОТКИ ИНФОРМАЦИИ В ЛАЗЕРНОМ ГИРОСКОПЕ С ПРЕЦИЗИОННОЙ РЕГИСТРАЦИЕЙ ПЕРЕМЕЩЕНИЙ ИНТЕРФЕРЕНЦИОННОЙ КАРТИНЫ Специальность 01.04.01 – Приборы и методы экспериментальной физики АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Рязань 2013 Работа выполнена в ФГБОУ ВПО Рязанский государственный радиотехнический университет Научный руководитель : Чиркин Михаил Викторович, доктор физико-математических наук, профессор...»

«АМИНИ Резо Наджафободи ФИЗИКО-ХИМИЧЕСКИЕ СВОЙСТВА ЦИНК-АЛЮМИНИЕВЫХ СПЛАВОВ, ЛЕГИРОВАННЫХ БЕРИЛЛИЕМ И МАГНИЕМ 02.00.04 – физическая химия АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Душанбе – 2012 Работа выполнена в лаборатории Коррозионностойкие материалы Института химии им. В.И. Никитина АН Республики Таджикистан. Научный руководитель : доктор химических наук, академик АН Республики Таджикистан, профессор Ганиев Изатулло Наврузович...»

«3 ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ1 Актуальность работы. На предприятиях, изготавливающих бесшовные горячекатаные трубы из легированных сталей, прошивка трубных заготовок является одним из основных производственных этапов. Качество продукции, производительность и ритмичность работы трубопрошивных станов во многом обусловлена износостойкостью их основного технологического инструмента – прошивных оправок. Циклическое температурно-силовое воздействие (ЦТСВ) при температурах до 950 C обусловливает...»

«Карамова Ольга Владимировна ОСОБЕННОСТИ РАЗВИТИЯ РОССИЙСКОЙ ЭКОНОМИЧЕСКОЙ НАУКИ: ВОПРОСЫ МЕТОДОЛОГИИ 08.00.01 – Экономическая теория АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора экономических наук Москва 2013 2 Работа выполнена на кафедре Микроэкономика ФГОБУВПО Финансовый университет при Правительстве Российской Федерации Официальные оппоненты : Шаховская Лариса Семеновна, доктор экономических наук, профессор, ФГБОУ ВПО Волгоградский государственный...»

«12322 483     !  $      # %& $& ' %!  # )&)$  & $ $ (  #'  $  $   #,  7?3286 45 286 7429 D C6F 736 28667 28 G' HIK %  JL     544  9  594 9 52 296   9 2 6 27659 44   84 4 !26 9 426 4   2    2  9  #6$%    544  9  594 9 52 296 1   6     9 2 6 & 7 ' 27 8 4 5  ( 934 2  56 #6$% 4   2 46 9 44 2   935   46 ) 65...»

«УДК 911.3:338.45 (100+73) (100 КУРИЧЕВ Николай Константинович ТЕРРИТОРИАЛЬНАЯ ОРГАНИЗАЦИЯ НИЗАЦИЯ ОБРАБАТЫВАЮЩЕЙ ПРОМЫШЛЕННОСТИ СТРАНЫ ШЛЕННОСТИ В МИРОХОЗЯЙСТВЕННОМ КОНТЕКСТЕ (НА ПРИМЕРЕ США) Специальность 25.00.24 – Экономическая, социальная оциальная, политическая и рекреационная география АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата географических наук Москва – Работа...»

«Ельцев Юрий Федорович МАГНИТНАЯ ФАЗОВАЯ ДИАГРАММА ВЫСОКОТЕМПЕРАТУРНЫХ СВЕРХПРОВОДНИКОВ 01.04.07 – физика конденсированного состояния Диссертация на соискание ученой степени доктора физико-математических наук Москва 2013 Работа выполнена в Федеральном государственном бюджетном учреждении науки Физическом институте им. П. Н. Лебедева Российской академии наук...»

«ВОЛОДИН Илья Александрович СТРУКТУРНО-ФУНКЦИОНАЛЬНАЯ ОРГАНИЗАЦИЯ ВНУТРИВИДОВОГО РАЗНООБРАЗИЯ ВОКАЛЬНОГО ПОВЕДЕНИЯ МЛЕКОПИТАЮЩИХ И ПТИЦ 03.02.04 – зоология ДИССЕРТАЦИЯ на соискание учёной степени доктора биологических наук в форме научного доклада Москва 2013 Работа выполнена на кафедре зоологии позвоночных биологического факультета ФГБОУ ВПО Московский государственный университет имени М.В....»

«МАМОНТОВ Виктор Андреевич НАУЧНЫЕ ОСНОВЫ ВОССТАНОВЛЕНИЯ РАБОТОСПОСОБНОСТИ СУДОВЫХ ГЛАВНЫХ ПЕРЕДАЧ ПРИ РЕМОНТЕ Специальность: 05.08.04 – Технология судостроения, судоремонта и организация судостроительного производства Автореферат диссертации на соискание ученой степени доктора технических наук Астрахань – 2012 2 Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования Астраханский государственный технический...»

«МАНАКОВ Алексей Леонидович ТЕОРИЯ, МЕТОДЫ И ПРАКТИКА СОВЕРШЕНСТВОВАНИЯ ОРГАНИЗАЦИИ ПОВЫШЕНИЯ КАЧЕСТВА И НАДЕЖНОСТИ ТЕХНИЧЕСКОГО СЕРВИСА ПУТЕВЫХ МАШИН НА ОСНОВЕ ОПЕРАЦИОННОГО МЕНЕДЖМЕНТА И ПРОЦЕССНОГО ПОДХОДА 05.02.22 – Организация производства (транспорт) (технические наук и) АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора технических наук Новосибирск - 2013 Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего...»

«АРХИПОВА ЭРЖЕНА ВЛАДИМИРОВНА ВЛИЯНИЕ ЭКСТРАКТА POTENTILLA ALBA L. И КОМПЛЕКСНОГО СРЕДСТВА ТИРЕОТОН НА ТЕЧЕНИЕ ЭКСПЕРИМЕНТАЛЬНОГО ГИПОТИРЕОЗА 14.03.06 – фармакология, клиническая фармакология АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата медицинских наук Улан-Удэ – 2012 Работа выполнена в ФГБУН Институт общей и экспериментальной биологии СО РАН Научный руководитель : доктор медицинских наук, Николаев Сергей Матвеевич профессор Официальные оппоненты : доктор...»






 
2014 www.av.disus.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.