34 вычислительные методы и программирование. 2011. Т. 12
УДК 519.6
СЕЙСМОРАЗВЕДКА И СУПЕРКОМПЬЮТЕРЫ
Е. А. Курин1
Рассматривается сейсмический метод поисков полезных ископаемых. Описываются основные
процедуры, применяемые при цифровой обработке данных сейсморазведки. Показывается необходимость использования высокопроизводительных вычислительных систем (суперкомпьютеров) для получения результатов в экономически оправданные сроки. Изучается производительность систем хранения данных российских суперкомпьютеров “Чебышев” и “Ломоносов” в задачах стандартной обработки данных сейсморазведки. Обсуждаются ресурсоемкие алгоритмы для подавления волн-помех, построения глубинных сейсмических изображений среды и коррекции статических поправок; приводятся примеры их применения. Статья рекомендована к печати программным комитетом Международной научной конференции “Научный сервис в сети Интернет: суперкомпьютерные центры и задачи” (http://agora.guru.ru/abrau).
Ключевые слова: сейсморазведка, суперкомпьютер, цифровая обработка данных, кратные волныпомехи, сейсмическая миграция.
1. Введение. При поисках, разведке и разработке нефтяных и газовых месторождений применяются математические методы, требующие большого объема вычислений в достаточно сжатые сроки. Здесь мы остановимся на задачах обработки данных, полученных при сейсмической разведке, так как именно они предъявляют самые высокие требования к объему вычислений. Разумеется, в отрасли существуют и другие области применения высокопроизводительных вычислений, например моделирование углеводородных систем в осадочных бассейнах, а также гидродинамическое моделирование в процессе добычи.
В работе [1] приводится сопоставление различных методов построения глубинного изображения среды по сейсмическим данным и необходимых вычислительных ресурсов. Там показано, что применение ряда эффективных процедур в экономически оправданные сроки требует применения суперкомпьютеров. Поэтому неудивительно, что высокопроизводительные вычисления в области сейсморазведки в настоящее время являются актуальной темой исследований специалистов нефтегазовых и сервисных компаний и академических организаций. В рамках каждой международной геофизической конференции (SEG, EAGE) проводятся соответствующие сессии или семинары. Организуются и специализированные мероприятия, например ежегодный семинар в Rice University (г. Хьюстон, США), посвященный высокопроизводительным вычислениям в нефтяной и газовой отрасли. Увеличилось количество публикаций на данную тему в геолого-геофизических периодических изданиях.
В настоящей статье дано краткое описание сейсмического метода поисков полезных ископаемых, сделан обзор задач и методов обработки сейсмических данных, а также рассмотрены отдельные процедуры, требующие применения высокопроизводительных вычислительных систем.
2. О сейсморазведке. Нефть и газ сосредоточены в так называемых ловушках. Они представляют собой участки пористых и проницаемых пород, в которых происходит накопление углеводородов. Эти породы перекрываются другими, непроницаемыми, породами, которые препятствуют дальнейшей миграции нефти и газа. Одной из основных задач сейсморазведки является поиск и определение пространственного положения глубинных структур, которые могли бы являться такими ловушками. Не менее важно построение геологической модели по всему месторождению для того, чтобы оптимальным образом осуществлять его разработку, сведя к минимуму технологические и экологические риски.
Напомним основы сейсмического метода. Вблизи поверхности Земли искусственно возбуждают упругие волны, которые распространяются в нижнее полупространство. Часть из них, претерпев отражение и преломление на границах раздела горных пород, возвращается к поверхности. Здесь происходит их регистрация специальными устройствами сейсмоприемниками. На акваториях процесс наблюдений происходит следующим образом: судно буксирует периодически срабатывающий источник и кабели, так называемые “косы”, с приемниками (гидрофонами). На суше обычно применяют взрывные или вибрационные источники и стационарно размещенные приемники (геофоны), для которых обеспечивается механический контакт с поверхностью наблюдений.
ООО “ГЕОЛАБ”, ул. Орджоникидзе, д. 12, стр. 4, 119071, Москва; генеральный директор, e-mail: [email protected] c Научно-исследовательский вычислительный центр МГУ им. М. В. Ломоносова вычислительные методы и программирование. 2011. Т. Чтобы показать, как работает сейсморазведка, рассмотрим простую модель, для которой проведем численный сейсмический эксперимент.
Предположим, что распространение волн в среде описывается акустическим волновым уравнением. Зададим форму отражающих границ, скорости (а) и плотности (б) в слоях между ними (рис. 1). Поместим источник вблизи поверхности в центре модели, а приемники вдоль поверхности. Произведем “взрыв” и будем следить, как меняется давление в разных точках нашей среды. Иными словами, будем решать акустическое скалярное волновое уравнение и исследовать его решение в различные моменты времени.
На рис. 2 показано волновое поле через 0.7 секунды после взрыва. Горизонтальная ось соответствует позиции приемника, а вертикальная глубине. а) б) Значение давления в каждой точке, Рис. 1. Модель среды соответствующее максимуму, показано черным цветом, а минимуму белым. Видно, что часть энергии отражается, а часть проходит дальше.
Отраженная волна доходит до поверхности, и вызываемые ею изменения давления записываются сейсмоприемниками. Именно такие, один раз отраженные волны и несут в себе основную полезную информацию о строении среды. На рис. 3 (через 0.9 секунды) виден процесс отражения от поверхности. На рис. 4 (через 1.2 секунды) показана волна, которая отразилась от границ два раза. Такие волны называются кратными. Они представляют собой серьезную помеху, которая затрудняет выделение и интерпретацию полезных волн.
Рис. 2. Волновое поле: Рис. 3. Волновое поле: Рис. 4. Волновое поле:
0.7 с после взрыва 0.9 с после взрыва 1.2 с после взрыва На рис. 5 показан результат одного сейсмического эксперимента сейсмограмма. Здесь к результату был добавлен случайный шум, который обычно присутствует в реальных данных. Горизонтальная ось соответствует позиции сейсмоприемника, вертикальная времени регистрации. Каждая запись по вертикали (сейсмическая трасса) соответствует сигналу, зарегистрированному отдельным приемником.
Помехи можно классифицировать как нерегулярные (случайный шум) и регулярные (например, прямые и поверхностные волны, многократные отражения). Как мы видим, сейсмограмма лишь отдаленно напоминает исходную модель. В результате наблюдений мы имеем набор сейсмограмм для всех произведенных взрывов. По ним необходимо узнать глубинное строение участка земной коры и попробовать оценить состав и свойства горных пород на этом участке, т.е. решить обратную задачу сейсморазведки.
Это достигается решением целого комплекса задач. В него входит подавление волн-помех, выделение и интерпретация полезного сигнала, повышение пространственного и временнго разрешения записи. Зао тем оценивается глубинно-скоростная модель среды и строится глубинное изображение. Наконец, можно попытаться оценить состав и свойства пород. При этом используется сложный и разнообразный математический аппарат. Необходимо решать системы линейных алгебраических уравнений большой размерности, производить интегральные преобразования (например, Фурье или Радона), рассчитывать и применять цифровые фильтры во временнй, пространственно-временнй, частотной и пространственно-частотной о о 36 вычислительные методы и программирование. 2011. Т. областях, решать задачи условной и безусловной оптимизации, дифференциальные уравнения в частных производных. В ряде процедур широко применяются вероятностные и статистические методы.
3. Суперкомпьютеры и некоторые задачи обработки данных. С момента своего появления компьютеры стали применяться при обработке сейсмических данных. Однако, несмотря на бурный рост возможностей вычислительной техники в последние десятилетия, оказывается, что эти возможности отстают от потребностей сейсморазведки. Например, в 2009 г. на месторождении Карачаганак (Казахстан) проводились трехмерные наблюдения на площади около 900 кв. км. При этом были зарегистрированы около трех миллиардов записей (трасс). Общий объем данных превысил 100 терабайт. Если мы попытаемся прочитать такой объем данных с внешних USBдисков на компьютер, то процесс чтения займет полтора месяца. Кроме того, данные надо еще обработать и записать результат обработки, что также потребует значительного времени. В настоящее время ни одна нефтяная компания не согласна ждать результата так долго, и необходимо применять более совершенные устройства для вычислений и хранения данных.
Рассмотрим, как обрабатываются данные при помощи стандартного набора процедур, в который обычно входят модули для работы с геометрией наблюдений и подавления регулярных и нерегулярных помех. Такие процедуры применяются последовательно к небольшим порциям данных, которые передаются по конвейеру. Отдельные порции данных обрабатываются независимо друг от друга. Для этого класса задач узким местом является подсистема ввода-вывода.
Поэтому идеальным компьютером для их решения буРис. 5. Сейсмограмма дет кластер с узлами, обладающими быстрым доступом к общей системе хранения данных (СХД).
Изучим, как эта проблема может быть решена на современных суперкомпьютерах, установленных в Московском государственном университете им. М. В. Ломоносова. На рис. 6 изображены результаты измерения скорости чтения и записи данных одним узлом в зависимости от количества одновременно читающих и пишущих узлов для суперкомпьютера “Чебышев”. Нетрудно посчитать, что, например, вычислительные методы и программирование. 2011. Т. узлов могут прочитать 100 терабайт за 8 часов. На рис. 7 приведены аналогичные измерения для новейшего суперкомпьютера “Ломоносов”, также установленного в МГУ. Время чтения 100 терабайт данных уменьшилось еще в три раза.
Далее мы остановимся на некоторых отдельных процедурах, требующих большого объема вычислений. Известно, что при обработке сейсмических данных, полученных на акваториях, остро стоит проблема подавления кратных волн-помех. Кратные волны образуются при многократном отражении от границ раздела горных пород, часто с участием отражения от дневной поверхности, и они затрудняют интерпретацию полезных волн. При подавлении таких помех применяются различные методы, например основанные на каких-либо отличиях в свойствах полезных волн и помех. Одним из самых эффективных способов подавления кратных волн является метод SRME (Surface-Related Multiple Elimination), предложенный профессором Беркхаутом из Делфтского университета в Нидерландах. Метод двухшаговый. На первом шаге делается прогнозирование помехи, а на втором ее адаптивное вычитание. Для прогнозирования одной трассы помехи производится попарная свертка трасс сейсмограмм общих пунктов взрыва и приема, к которым принадлежит эта трасса, в пределах некоторой апертуры. На втором шаге производится поиск многоканального фильтра, который оптимальным образом адаптирует оценку помехи к реальным данным. После применения фильтра помеха вычитается из данных. В двумерном, а особенно в трехмерном, случае мы имеем значительный объем как ввода-вывода, так и вычислений. Рассмотрим пример применения метода 3D SRME для морских широкоазимутальных данных по площади 400 кв. км и размером порядка 1 терабайта. В процессе вычислений производится около 100 миллиардов операций дискретной свертки одномерных массивов, каждый из которых состоит из 2000 элементов. Трафик данных составляет более одного петабайта. Если бы мы доверили вычисления одному единственному, пусть самому быстрому, серверу, то получили бы результат через три года. С практической точки зрения это лишено всякого смысла. Однако при использовании лишь пятой части суперкомпьютера “Ломоносов” для получения результатов хватило бы трех дней. На рис. 8 приведены сейсмические разрезы по исходным данным (а) и по результату подавления кратных волн-помех (б). Здесь нам удалось добиться высокого качества подавления помехи.
Рис. 8. Подавление кратных волн-помех Рис. 9. Построение глубинного изображения методом 3D SRME (по [8] с изменениями) среды различными методами (по [2] Следующий важный класс алгоритмов посвящен построению глубинного сейсмического изображения среды по данным и по предварительно оцененной глубинно-скоростной модели. Этот процесс называется сейсмической миграцией. Самым простым, интуитивно понятным и быстрым является метод, основанный на вычислении приближения к интегралу Кирхгофа. С вычислительной точки зрения он сводится к суммированию отсчетов входных данных вдоль некоторой траектории, зависящей от скорости в среде. Таким образом, для получения одного отсчета результата необходим доступ к значительной части данных. При этом размер данных может быть порядка нескольких терабайт. Идеальный компьютер для решения этой задачи с общей памятью, вмещающей входные данные и результат интегрирования. Возможно эффективное решение задачи на кластере с быстрой коммуникационной сетью, где организовано оптимальное размещение входных данных в распределенном массиве.
Альтернативный метод построения глубинного изображения это миграция в обратном времени (reverse time migration, RTM). Для каждого пункта взрыва моделируется и запоминается на диске волновое поле во все моменты времени в пределах интервала записи данных. Затем для соответствующей этому пункту взрыва сейсмограммы производится продолжение волнового поля, зарегистрированного на поверхности, в обратном времени. Это также делается во все моменты времени в пределах интервала записи.
И наконец, посредством корреляции этих полей получают глубинное изображение среды. Очевидно, что для быстрой работы алгоритма необходимо наличие быстрых жестких дисков на каждом вычислительном узле. Этот метод требует значительно бльших вычислительных затрат по сравнению с предыдущим, однако в ряде случаев дает лучший результат. В работе [2] (см. рис. 9) приведен пример сравнения результатов, полученных при использовании обоих описанных алгоритмов для сложных данных из района с соляно-купольной тектоникой. Здесь целью являлось построение глубинного изображения соляного тела с “карнизом”, а также примыкающих к нему слоев осадочных отложений. На рис. 9а приводится результат миграции методом Кирхгофа, а на рис. 9б результат миграции в обратном времени. В областях с номером 1 оба метода дают приемлемое качество изображения, а области с номером 2 это зона, где конфигурацию соляного тела можно получить только при помощи времяемкого алгоритма миграции в обратном времени. В обоих случаях время вычислений составляет около двух недель. Однако если для получения результата при помощи миграции Кирхгофа достаточно кластера с 32 узлами, то для миграции в обратном времени требуется суперкомпьютер с сотнями вычислительных узлов.
Ряд задач обработки сейсмических данных подразумевает то, для чего современные суперкомпьютеры общего назначения, собственно, и спроектированы: решение систем линейных алгебраических уравнений большой размерности. К таким задачам можно отнести, в первую очередь, определение статических поправок для площадных (3D) данных. Статические поправки представляют собой временные задержки, связанные с рельефом дневной поверхности и неоднородностями верхней части разреза. Качество определения и учета статических поправок непосредственно влияет как на надежность выделения и корреляцию отраженных волн, так и на достоверность последующих глубинных построений. Наличие статических сдвигов препятствует синфазному суммированию полезных волн. Для решения этой задачи предложено много методов, более или менее эффективных в различных условиях. Многие из них сводятся к решению системы линейных алгебраических уравнений, размерность которых зачастую превышает произведение количества пунктов взрыва и количества пунктов приема, используемых в процессе наблюдений на исследуемой площади. При этом такая система, как правило, вырожденная, и ее решение может осуществляться методом наименьших квадратов. Для уменьшения размера оперативной памяти, требуемой для решения, используются некоторые свойства системы уравнений, в частности разреженность и характерная блочная структура. К системам линейных алгебраических уравнений также приводят другие задачи, например различные томографические методы оценки глубинно-скоростной модели среды по временам пробега отраженных волн, сейсмическое моделирование и полноволновая инверсия (full-waveform inversion, FWI) в частотной области.
Следует также упомянуть о нестандартных вычислительных технологиях, используемых при работе с сейсмическими данными. В настоящее время наблюдается большой интерес разработчиков к различного рода аппаратным ускорителям. В частности, опубликован ряд работ по использованию графических процессоров общего назначения (GPU) для решения отдельных задач сейсмического моделирования и построения глубинных изображений. При этом обычно применяется технология CUDA, разрабатываемая и продвигаемая компанией NVidia. Распространение этой технологии на более широкий класс задач сдерживается особенностями архитектуры графических процессоров и ограничениями производительности интерфейса PCI-E, служащего для соединения плат ускорителей с материнской вычислительной системой. Кроме того, существуют работы по оптимизации ряда алгоритмов обработки для ускорителей на основе ПЛИС (FPGA). Ознакомиться с работами в области применения аппаратных ускорителей вычислений для сейсмических задач можно по материалам семинара [3].
4. Заключение. В настоящей статье описаны цели, стоящие перед сейсморазведкой, и дан обзор задач, которые необходимо решать в процессе обработки сейсмических данных. Приведены примеры, показывающие, что в ряде случаев применение суперкомпьютеров позволяет значительно улучшить качество результатов обработки и построения глубинных изображений среды, а также обеспечить решение вычислительные методы и программирование. 2011. Т. задач в экономически оправданные сроки.
К сожалению, в рамках одной работы невозможно дать полный обзор вычислительных методов и технологий, используемых при обработке и интерпретации данных сейсморазведки. Поэтому ниже приводятся ссылки на источники, которые могут послужить отправными точками в изучении проблемы.
Подробнее ознакомиться с сейсмическим методом поисков и разведки полезных ископаемых можно, например, по книге [4]. Справочник [5] поможет составить представление обо всем многообразии математического аппарата, используемого в разведочной геофизике и, в частности, в сейсморазведке.
Работа [6] интересна тем, что в ней исследуются вопросы программной реализации алгоритмов обработки сейсмических данных. На том же сайте (проект CREWES, университет Калгари, Канада) доступны исходные коды программ, описанных в работе. Исчерпывающий и превосходно иллюстрированный учебный материал по различным вопросам анализа сейсмических данных можно найти в [7]. В работе [9] делается анализ производительности компьютеров на примере типичных задач обработки сейсмических данных. С самыми последними тенденциями в области высокопроизводительных вычислений в нефтяной и газовой отрасли можно ознакомиться по материалам уже упоминавшегося семинара [3].
СПИСОК ЛИТЕРАТУРЫ
1. Camp W.J, Thierry P. Trends for high-performance scientic computing // The Leading Edge. 2010. 29. 44–47.2. Suh S.Y., Yeh A., Wang B., Cai J., Yoon K., Li Z. Cluster programming for reverse time migration // The Leading Edge. 2010. 29. 94–97.
3. Материалы семинара по высокопроизводительным вычислениям в нефтяной и газовой отрасли (www.og-hpc.org).
4. Шерифф Р., Гелдарт Л. Сейсморазведка. М.: Мир, 1987.
5. Вычислительные математика и техника в разведочной геофизике. Справочник геофизика / Под ред. В. И. Дмитриева. М.: Недра, 1982.
6. Margrave G.F. Numerical methods in exploration seismology with algorithms in MATLAB. (www.crewes.org/ResearchLinks/FreeSoftware/EduSoftware/NumMeth.pdf).
7. Yilmaz O. Seismic data analysis. Tulsa: Society of Exploration Geophysicists, 2001.
8. Kurin E., Lokshtanov D., Helgesen H.K. Surface related multiple elimination for WATS data // Proc. of the 72nd EAGE Conference and Exhibition. Barcelona, 2010.
9. Курин Е.А. О производительности компьютеров для обработки данных сейсморазведки // Технологии сейсморазведки. 2007. № 4. 69–76.