Sie sind auf Seite 1von 122

Student Lecture Tour

RUSSIA & CIS 2011-2012

Geological Modelling on
the Base of Geostatistics
By Evge n iy Kovalevs kiy (C e ntral Ge ophys ical Expe diti o n (CG E ) )

CO U RS E N OTE

www.eage.org

14549-SLT RU handout.indd 1 09-09-11 10:20


SLT Europe

The Student Lecture Tour (SLT) is brought


to you by the EAGE Student Fund
Including EAGE, Shell, CGGVeritas, PGS and
WesternGeco

EAGE Student Membership

FREE Student Membership for one year – after that only € 25 a year

• A free copy of First Break every month


• Free online subscription to one of EAGE’s scientific journals
• Access to EarthDoc, EAGE’s online publication database (> 35,000
papers online)
• Attractive discounts in the online EAGE bookshop
• Discount on all EAGE events worldwide
Saint Petersburg 2012 Student Programme

Saint Petersburg 2012 International Conference & Exhibition


Geosciences: Making the most of the Earth’s resources
2-5 April 2012, Saint Petersburg, Russia

• Call for student papers open soon!


• Travel Grants also available for students
• 2 ½ Day parallel Student Day Programme including:
– Student Short Courses/ Workshops
– Lectures
– Exhibition Tour
– Geo-Quiz
– Student poster presentations
– Debates
• Technical Programme
• Conference Evening

PGCE 2012 Student Programme

• Petroleum Geology Conference & Exhibition 2012


• 23-24 April, Kuala Lumpur, Malaysia
• Call for student papers opening soon!
• Travel grants available soon!
• 1 ½ Day parallel Student Programme including:
• Lectures
• Geo-Quiz
Copenhagen 2012 Student Programme

74th EAGE Conference & Exhibition incorporating SPE EUROPEC 2012


4-7 June, Copenhagen, Denmark

• Call for student papers open soon!


• Travel Grants also available for students!
• 4-Day parallel Student Programme including:
- Student Short Courses/ Workshops
- Student Poster Presentations
- Exhibition Tours
- Student Debates
- Trial Interviews
- Geo-Quiz
- Field trip
- FIELD Challenge (Fully Integrated EvaLuation and Development)
• Student Evening party - Don’t miss it!

FIELD Challenge
FIELD Challenge
(Fully Integrated EvaLuation and Development)

Promoting cross-disciplinary geoscience and engineering integration in university


departments.

Apply for the 2012 FIELD Challenge with a team essay of 2,000 - 3,000 words on ‘The
value of integration between Geoscience and Engineering’ before Wednesday 30
November 2011.

The challenge will include:


• 6 to 8 participating university teams
• Sponsored Data Set (by Total)
• Travel grants to attend Vienna conference and exhibition (23-26 May)
• Presentation of FIELD development plan
• Evaluation jury
• Cash prizes
Other Student Activities

Geophysics Boot Camp 2012


A European Geophysics Camp, giving students and young professionals
the opportunity to experience seismic acquisition techniques.

EAGE Student Chapters

Start up a Student Chapter today and win sponsored attendance to


Copenhagen ‘12!

Student Social Media

Find us on Facebook and LinkedIn for updates, news, discussions, career


and recruitment opportunities.

SLT Russia & CIS 2011-2012

Geological Modelling on the Base of


Geostatistics

By Evgeniy Kovalevskiy
Central Geophysical Expedition (CGE)
История и содержание курса
1997 год. На конференции EAGE в Женеве Е. Ковалевский показывает стендовый доклад
«Нечеткая геологическая модель». Его выслушивает Оливье Дюбрул и замечает, что
представление неопределенности в нечеткой модели похоже на представление в геостатистике.
Удивительно, но Ковалевский ничего не знает о геостатистике.

2005 год. Книга Оливье Дюбрула «Использование геостатистики для включения в геологическую
модель сейсмических данных (DISC-2003)» выходит на русском языке в переводе Ковалевского.
Сразу после этого Ковалевский начинает читать краткие курсы по геостатистике на конференциях,
в университетах и компаниях. Позже он превращает свои лекции по книге О. Дюбрула в
семестровые курсы геостатистики в МГУ (осенний семестр 2007 года), МФТИ (с 2007 года по
настоящее время) и в РГГРУ (с 2008 года по настоящее время). Курсы сопровождаются
практическими занятиями в системе геологического моделирования DV-Geo. Многие начинают
считать, что Ковалевский является убежденным сторонником геостатистики.

Вместе с тем, нет более вдохновенного критика геостатистики, чем Ковалевский. Он утверждает,
что исходное допущение геостатистики (о статистической однородности геологической среды)
выполняется очень редко. Индикаторное моделирование, по его мнению, представляет собой
самую тусклую часть геостатистики. Но это спасательный круг, без которого она очень часто идет
ко дну. Преобразование «Normal Score» – второй спасательный круг, однако можно привести
примеры, не оставляющие от этого метода камня на камне. Объектное моделирование – голая
эвристика, которая хорошо работает только тогда, когда на площади мало скважин.
Многоточечная геостатистика – на нее можно положиться, если обучающий образ предоставит все
знающий абсолютный разум. Геостатистическая сейсмическая инверсия – прогнозирует свойства
среды с высоким разрешением и точно воспроизводит реальные сейсмические трассы, но только
вдали от скважин, поскольку скважины не позволяют врать. И так далее, и тому подобное... И все
это он говорит потому, что ревнует свою нечеткую модель.

2011–2012 годы, студенческое лекционное турне EAGE. На самом деле, резкая критика,
основанная на ревности – не более чем лекторский прием. Выступая серьезно,
Ковалевский не устает повторять, что геостатистика представляет собой
авангард геологического моделирования. Рассказывать ее легко, поскольку в ее
основе лежит несколько блестящих идей. Главные свои плоды геостатистика
приносит после интеграции с гидродинамическим моделированием, об этом
тоже идет речь. Автор надеется, что в результате этого курса вы поймете
геостатистику, полюбите ее и научитесь ее применять. И, конечно, рассмотрим
нечеткую геологическую модель.

2
Предисловие
В настоящее время в свободном доступе имеется достаточное число лекционных курсов и книг по
геостатистике, и любой желающий может изучить эту тему самостоятельно. Но самый короткий
путь к знанию – спросить у того, кто знает. Если вы действительно хотите понять, что такое
геостатистика, в чем ее сильные и слабые стороны, что она может и что она не может дать при
геологическом моделировании – я смогу вам это объяснить. Потому что только что прошел этот
путь, преодолевая собственное непонимание и делая ошибки.

Курс, предлагаемый вашему вниманию, основан на книге Оливье Дюбрула «Использование


геостатистики для включения в геологическую модель сейсмических данных». Что это означает?
Сразу хочу сказать следующее. Если у вас есть возможность пригласить в качестве лектора
О. Дюбрула – сделайте это немедленно. Это будет наилучшим решением. Он научит вас (как
научил и продолжает учить меня) не только геостатистике.

Что касается меня, то я, как мне кажется, использую логику его книги. Многие мои иллюстрации
являются аналогами иллюстраций О. Дюбрула. Но слова, очень часто, я произношу другие. Иначе
и быть не может. Во-первых, некоторые вопросы, описанные в его книге, я до сих пор не
прочувствовал в полной мере. Во-вторых, как говорилось на предыдущей странице, в моем взгляде
на геостатистику по субъективной причине присутствует значительный критический аспект. И,
наконец, у меня есть свой преподавательский опыт и свои представления о том, как сделать
изложение геостатистики наиболее понятным для слушателя. Из первого, второго и третьего
следует, что О. Дюбрул никакой ответственности за мой курс не несет.

Что еще необходимо сказать в связи с данным конспектом? Основная моя работа заключается в
том, что как ведущий инженер Центральной геофизической экспедиции я участвую в создании
программной системы геологического моделирования DV-Geo. В сферу моей ответственности
входит научное руководство разработкой модуля геостатистического моделирования и подготовка
методических документов для пользователей. Наиболее интересные материалы, с которыми я
имею дело по работе, также включены в данный лекционный курс. Благодарность своим коллегам
я приношу на его последней странице.

3
Содержание
1. Введение 6
1.1. Что такое геологическая модель. Иерархия геологических моделей 6
1.2. Этапы построения геологической модели 7
1.3. Главная интрига геологического моделирования 9
1.4. Детерминированная и геостатистическая модель 10
1.5. Обзор содержания курса 12

2. Ковариация и вариограмма 15
2.1. Как статистика появляется в геологии. Среднее значение и дисперсия 15
2.2. Стационарность 16
2.3. Первый критерий стационарности. Анализ гистограмм 19
2.4. Исходное положение геостатистики 21
2.5. Ковариация двух случайных переменных X и Y 22
2.6. Ковариация случайной переменной Z(x). Вариограмма 23
2.7. Расчет экспериментальной вариограммы. Модели вариограмм 25
2.8. Параметры вариограммы: радиус, порог, эффект самородков, поведение вблизи нуля 27
2.9. Анизотропия вариограммы. Вариограмма в пространстве 3D 28
2.10. Априорная модель случайной переменной 30
2.11. Суть геостатистики 32

3. Кригинг 38
3.1. Что такое кригинг? 38
3.2. Вывод системы уравнений кригинга 39
3.2.1. Простой кригинг 40
3.2.2. Универсальный кригинг 42
3.2.3. Обыкновенный кригинг 44
3.3. Скользящая окрестность 46
3.4. Стандартное отклонение кригинга 47
3.5. Особенности кригинга, обусловленные моделью вариограммы 49
3.6. Перекрестная проверка 50
3.7. Почему кригинг называют оптимальной интерполяцией 51
3.8. Кокригинг ошибок и факторный кригинг 53
3.9. Кригинг как рабочий процесс. О корректном применении кригинга 55

4. Кригинг с использованием вспомогательной переменной 58


4.1. Кригинг с внешним дрейфом (КВД) 59
4.2. Кросс-ковариация 61
4.3. Совместный кокригинг 63
4.4. Выводы в отношении кригинга с использованием вспомогательной переменной 65

5. Стохастические реализации 66
5.1. Метод последовательного гауссовского стохастического моделирования (ПГСМ) 66
5.2. Кригинг и стохастические реализации в пространстве 2D. Методика анализа качества 69
интерполяции
5.3. Исходные данные примера в пространстве 3D. Детерминированная интерполяция в 71
пространстве 3D
5.4. Кригинг и стохастические реализации в пространстве 3D 74
5.5. Последовательное индикаторное стохастическое моделирование (ПИСМ) 78

4
5.6. Расчет реализаций параметра с разделением на категории 81
5.7. Расчет реализаций параметра с использованием преобразования «Normal Score» 85

6. Неклассические стохастические методы 91


6.1. Объектное моделирование 91
6.2. Многоточечная геостатистика 92
6.3. Нечеткая геологическая модель 95
6.3.1. Введение 95
6.3.2. Нечеткое представление значения параметра в элементарном объеме среды 96
6.3.3. Порождение и суммирование свидетельств 97
6.3.4. Расчет реализаций нечеткой модели 99
6.3.5. Расчет реализаций нечеткой модели для примера со скважинными 101
данными APS
6.3.6. Сравнение реализаций нечеткой модели и реализаций «Normal Score» 103

7. Стохастическая сейсмическая инверсия 106

8. Использование стохастических реализаций 109


8.1. Использование стохастических реализаций при прокладке траектории скважины 109
8.2. Использование стохастических реализаций для адаптации геологической модели к 110
истории разработки

Заключение и благодарности 116

Ссылки 117

5
1. Введение
Поскольку раздел «Введение» читает больше людей, чем всю книгу, то мы постараемся именно в
нем рассказать, что такое «геологическая модель» и что такое «геостатистика». Начнем мы с
описания иерархии геологических моделей, дальше скажем об основных этапах создания
геологической модели и о том, как в ходе построения модели мы сочетаем формальные и
неформальные процедуры. Завершая вводный рассказ о моделях мы опишем главную интригу
геологического моделирования. Если коротко, то она заключается в том, что свойства
геологической среды нельзя интерполировать обычным путем. В том смысле, что значения
свойств в промежутке между точками с известными значениями не являются промежуточными по
значению.

После этого мы перейдем к геостатистике. Сначала мы объясним, по какой причине появилось


геостатистическое моделирование, что новое и очень важное оно несет, и почему, начиная с
некоторого момента, традиционные детерминированные модели перестали нас устраивать. Затем
мы дадим обзор геостатистических методов в их исторической перспективе, поскольку появились
они не в один день. Это важно потому, что при изложении основных идей геостатистики мы этой
исторической последовательности придерживаться не будем.

1.1. Что такое геологическая модель. Иерархия геологических моделей

Что такое геологическая модель? Геологической моделью мы называем цифровое представление


реальной геологической среды на том уровне абстракции, который достаточен для решения
поставленной задачи. Какой именно задачи? Во время поиска, разведки и разработки
месторождений нефти и газа мы решаем не одну, а некоторую последовательность задач, и для их
решения мы используем последовательность моделей. Этот последовательный ряд моделей можно
сравнить с набором увеличительных стекол – каждая следующая модель соответствует более
сильному увеличительному стеклу. Детальность описания объекта при этом возрастает, но сам
объект изучения, как правило, уменьшается. Именно поэтому мы говорим об иерархии моделей.
Итак, какие модели составляют эту иерархию?
Верхний уровень в названной иерархии занимают региональные модели. Это модели участков
земной поверхности протяженностью в тысячи километров. На этом уровне решается задача,
могут ли быть в данном регионе (а если да, то на каких участках и на каких горизонтах)
промышленные залежи углеводородов. Как известно, условием образования залежей является
наличие пластов коллектора (песчаников, известняков), перекрытых непроницаемыми
(глинистыми) покрышками. Еще одним условием образования залежей является наличие
тектонических нарушений, открывающих пути миграции углеводородов. Исходные данные для
построения региональных моделей дают опорные и параметрические скважины, региональные
сейсмические профили, структурно-тектонические карты и многое другое. Системы
моделирования регионального уровня должны уметь работать с истинными географическими
координатами, поскольку кривизна земной поверхности является в этих моделях вполне
ощутимой.
Второй уровень иерархии – поисковые модели. Области моделирования при этом становятся
меньше – порядка сотни километров, поскольку касаются уже не всего региона, а только его
наиболее перспективных участков. Задача этого уровня – картирование в границах заданного
участка кровли нефтеносного горизонта и прослеживание там же основных тектонических
нарушений. Цель названного картирования – выявление структурных и неструктурных ловушек.

6
Главными исходными данными при этом являются результаты сейсмических наблюдений по сети
поисковых профилей. Основное внимание на данном этапе уделяется расчету скоростей
сейсмических волн, суммированию и миграционным преобразованиям, поскольку именно эти
процедуры определяют качество получаемых глубинных разрезов.

После того, как поисковая скважина, пробуренная в своде предполагаемой ловушки, подтверждает
наличие в ней промышленных запасов нефти или газа, считается, что открытие месторождения
состоялось. Дальше начинается разведочный этап. На этом этапе бурится группа разведочных
скважин, а также, если это приемлемо по экономическим показателям, выполняются
сейсморазведочные работы 3D. Область моделирования при этом еще более сокращается (до
размера порядка десяти километров), поскольку охватывает уже только конкретное
месторождение. Данную модель мы относим к третьему уровню иерархии. На этом уровне
решаются задачи точной геометризации природного резервуара, определения уровней ВНК и ГНК,
детального прогноза коллекторских свойств, подсчета запасов. Затем, уже в процессе разработки,
в каждой пробуренной эксплуатационной скважине в обязательном порядке выполняются
исследования методами ГИС, после чего в детальную геологическую модель резервуара вносятся
необходимые уточнения.

Последний, четвертый уровень иерархии представляет геолого-технологическая модель, на базе


которой ведется разработка месторождения. Геолого-технологическая модель создается на основе
детальной геологической модели посредством пересчета последней на более крупную сетку.
Главная особенность геолого-технологической модели состоит в том, что она является
динамической. То есть, в отличие от предыдущей (статической) модели, она включает еще и
динамические параметры – давления и текущие насыщения в ячейках, дебиты скважин по воде,
нефти и газу, объемы закачиваемой жидкости и т.д. Расчет динамических параметров модели
производится при помощи специализированных программ – так называемых гидродинамических
симуляторов. Отклонения расчетных динамических параметров на скважинах от реальных
измеряемых значений указывают на необходимость коррекции исходной статической модели. Эту
коррекцию называют адаптацией модели к истории разработки. Геолого-технологическую модель
используют для прогноза и оптимизации процесса добычи многие годы, в течение всей жизни
месторождения.

В ходе данного курса мы будем в основном говорить о моделях, относящихся к третьему уровню
рассмотренной иерархии, то есть о детальных моделях природных резервуаров. Региональных
моделей мы касаться не будем. Поисковые и гидродинамические модели мы будем рассматривать
в отдельных, специально оговоренных случаях.

1.2. Этапы построения геологической модели

Как известно, модель природного резервуара строится в два этапа: на первом этапе создается
геометрический каркас модели, выделяются пласты, строятся их кровли и подошвы, а затем, на
втором этапе, прогнозируются свойства в объеме выделенных пластов.

Каркас детальной геологической модели создается на основании двух видов данных. Первое – это
структурные поверхности, получаемые из 2D и 3D сейсмики. Очень часто это всего одна опорная
отражающая поверхность, которая находится вблизи кровли резервуара, и еще, возможно,
несколько субвертикальных поверхностей тектонических нарушений. Вторым видом данных при
создании каркаса являются результаты детальной корреляции скважин по данным ГИС. По
отметкам детальной корреляции на скважинах интерполируются стратиграфические поверхности,

7
причем в ходе этой интерполяции стараются учесть и рельеф опорного отражающего горизонта, и
выделенные тектонические нарушения. Построенные стратиграфические поверхности и
поверхности нарушений в совокупности составляют нужный нам каркас, или, другими словами,
геометрическую модель. Главное назначение геометрической модели – на ее основе
рассчитывается стратиграфическая сетка. На этом первый этап моделирования завершается.

На втором этапе геологического моделирования выполняется интерполяция скважинных данных о


свойствах резервуара в межскважинное пространство. Эта интерполяция производится в
координатах стратиграфической сетки. Почему? Поскольку стратиграфические поверхности в
момент формирования осадочных пластов направлены горизонтально, изменчивость
геологической среды вдоль них минимальна. Следовательно, интерполяция на стратиграфической
сетке наиболее достоверна. Наряду со скважинными данными в ходе интерполяции свойств могут
использоваться значения сейсмических атрибутов.

Выше мы описали не очень сложный процесс формального построения модели, основным


содержанием которого являются процедуры интерполяции, сначала поверхностей, затем
пространственных свойств. Но у этого процесса есть еще и вторая, неформальная сторона, которая
его существенно усложняет. А именно, при построении модели необходимо помнить о том, что
она должна соответствовать не только конкретным сейсмическим и скважинным данным, но и
нашим знаниям о процессах формирования геологической среды.

Поэтому, уже на самом раннем этапе знакомства с данными, или даже просто на основании общих
представлений о районе работ выдвигается гипотеза в отношении генезиса соответствующего
геологического объекта. Далее, параллельно с созданием модели и включением в нее новых и
новых данных эта гипотеза углубляется и уточняется. Зачем она нужна? Гипотеза в отношении
генезиса геологического объекта нужна постольку, поскольку именно она представляет собой
единственную объективную основу для интеграции и верификации самых разных видов данных.
Действительно, что есть общего, например, у сейсмического разреза и у микрофотографий
отшлифованного керна? Общим является то, что каждый из названных видов данных по-своему
отображает один и тот же генезис геологического объекта – ту или иную древнюю обстановку
осадконакопления, тектонический режим, постседиментационные процессы и т.д., и т.п. Если нам
удается выработать гипотезу, которая подтверждает (и подтверждается!) всеми видами данных –
на нашу модель можно положиться, и даже там, где данных недостаточно. И наоборот, пока
правомерная гипотеза в отношении генезиса геологического объекта не выработана, модели у нас
нет, и мы не можем доверять рассчитанным кубам свойств.

Каким образом мы включаем в модель представления о генезисе геологического объекта?


Наиболее явными возможностями являются две. Первая возможность – это детальная корреляция
скважин по данным ГИС. Отметки на скважинах в очень большой степени (а на разбуренных
площадях – практически полностью) определяют стратиграфический каркас модели. Поэтому
детальная корреляция скважин должна выполняться в связи с некоторой правомерной гипотезой в
отношении типа и пространственного строения древней обстановки осадконакопления.
Геостатистическая модель нуждается в качественной корреляции скважин ничуть не меньше
традиционной детерминированной. Мы всегда будем исходить из того, что детальная корреляция
скважин выполнена наилучшим образом. Но больше говорить о корреляции мы не будем.

Вторая возможность включить в модель наши представления о генезисе объекта – это


интерполяция свойств в межскважинном пространстве. Получаемые в результате интерполяции
пространственные распределения параметров должны соответствовать тем представлениям о
генезисе геологического объекта, которые имеет геолог. Поскольку интерполировать данные

8
можно по-разному, возможность получить нужный результат всегда имеется. Вот об
интерполяции мы будем говорить очень много.

1.3. Главная интрига геологического моделирования

Какие скважинные данные мы интерполируем в процессе построения геологической модели? Мы


интерполируем литологию, пористость, проницаемость и насыщенность.

Здесь необходимо сделать одну оговорку. А именно, мы не имеем непосредственных значений


литологии, пористости, проницаемости и насыщенности на подавляющем большинстве скважин.
На основной части скважин мы имеем только данные ГИС – каротажные кривые различных
геофизических методов. То есть, к интерполяции названных параметров мы сможем приступить
лишь после того, как получим их значения на траекториях скважин в результате интерпретации
данных ГИС.

Однако продолжим. Зададим следующий вопрос: зачем нам прогнозировать литологию, если для
подсчета запасов и расчета фильтрации флюидов нам необходимы только пористость,
проницаемость и насыщенность? Причина здесь в том, что мы не можем интерполировать
пористость и другие параметры между скважинами напрямую. Почему? Чтобы ответить на это,
рассмотрим следующий пример. Он включает гистограмму значений параметра альфа-ПС
(нормализованного параметра ПС), рассчитанную по скважинным данным на некоторой площади,
и гистограмму того же параметра после интерполяции скважинных данных в объеме среды
(рис. 1).

Рис. 1. Гистограммы значений параметра альфа-ПС. Красная кривая – по исходным


скважинным данным, серая кривая – после интерполяции в объеме среды.

Обратите внимание, исходная гистограмма параметра по скважинным данным имеет двугорбый


вид (красная кривая). Эта «двугорбость» указывает на то, что геологическая среда состоит из двух
категорий пород – коллекторов с высокими значениями альфа-ПС и неколлекторов с низкими
значениями. Пород с промежуточными значениями альфа-ПС немного. Среду такого типа
называют категориальной. В некоторых случаях число категорий может быть больше двух.

9
Если интерполировать параметр между скважинами напрямую, то гистограмма значений
пористости в объеме будет иметь вид, представленный на том же рисунке серой кривой.
Поскольку скважины размещены на рассматриваемой площади равномерно (что мы увидим, когда
будем рассматривать этот пример подробно), мы вправе ожидать сходства двух гистограмм.
Однако никакого сходства нет – после интерполяции исходные явно выраженные максимумы
распределения почти исчезают и бессмысленные промежуточные (по величине) значения альфа-
ПС начинают преобладать. Очевидно, что такая интерполяция является ошибочной. То есть, мы
видим, что непосредственно интерполировать скважинные данные в категориальной среде нельзя.
Возможно, их вообще нельзя интерполировать. Это обстоятельство мы и называем главной
интригой геологического моделирования.

Именно для исключения (насколько это возможно) показанной ошибки, до интерполяции этого
или любого другого параметра производят разделение геологической среды на категории, то есть
выполняют интерполяцию литологии. При этом чаще всего используют только две категории
пород – коллектор и неколлектор. После названного разделения интерполяцию пористости
производят обычно только в пределах коллектора. Такой подход позволяет лучше воспроизвести в
объеме гистограмму скважинных данных (в той ее части, которая соответствует коллектору).

Однако в том, что мы исключаем из рассмотрения весь условный «неколлектор», ничего хорошего
нет. Во-первых, мы сами себе создаем проблему порога. Попробуйте, например, выбрать
пороговое значение для разделения среды на коллектор и неколлектор на гистограмме
скважинных данных на рис. 1. Во-вторых, объем исключаемого неколлектора может быть очень
велик, вследствие чего даже малая его пористость может иметь большое значение. Наконец, и это
в-третьих, необходимо иметь в виду, что строгого обоснования интерполяция параметров в
несвязной (или в многосвязной) области коллектора не имеет.

1.4. Детерминированная и геостатистическая модель

После широкого распространения геостатистики все предшествующее моделирование начали


называть детерминированным. Зададим простой вопрос: «Почему, начиная с некоторого момента,
детерминированное моделирование перестало нас устраивать?»

Рассмотрим в этой связи сечение куба литологии, который мы рассчитали для одной из
детерминированных, как мы сейчас говорим, моделей (рис. 2). Этот куб точно соответствует
имеющимся скважинным данным. Беда только в том, что его горизонтальная изменчивость в
разбуренной части площади (левая половина сечения) резко отличается от той же самой
изменчивости в неразбуренной части площади (правая половина сечения). Понятно, что такой
особенности в реальной среде быть не может.

Из картины на рис. 2 можно сделать два вывода. Первый вывод (очевидный) состоит в том, что
детерминированная интерполяция дает нам ложное представление о среде в правой части сечения,
то есть там, где у нас недостаточная плотность данных. Второй вывод (менее очевидный) – левой
половине мы тоже не можем доверять до тех пор, пока мы не определим, какова истинная
изменчивость среды.

Так вот, детерминированное моделирование перестало нас устраивать ровно с того момента, как
мы поняли, что оно не позволяет нам сначала определять, а затем воспроизводить в модели
истинную пространственную изменчивость среды.

10
К каким негативным последствиям приводит детерминированное моделирование? К низкой
точности прогноза? Нет, не только. Мы вообще не можем говорить о какой-либо точности
прогноза на правой части сечения на рис. 2, когда картина принципиально неверна. Когда модель
содержит столь очевидный изъян, наивно надеяться, что мы сумеем правильно подсчитать запасы,
или, тем более, адаптировать ее к данным разработки.

Рис. 2. Сечение куба литологии детерминированной модели. Светлым тоном обозначен


коллектор, темным – неколлектор. На врезке внизу – план размещения скважин и
положение секущей плоскости.

Что вместо этого предлагает геостатистика? Единственного куба литологии, имеющего всюду
истинную изменчивость (хотя бы как в левой части рис. 2) она дать не может, поскольку в
неразбуренной части площади скважин как не было, так и нет. Но геостатистика может дать
множество кубов литологии (так называемых реализаций), каждый из которых точно
соответствует имеющимся скважинным данным (первое) и точно воспроизводит истинную
изменчивость геологической среды (второе). Различия между этими реализациями (которые будут
велики именно в правой части приведенного сечения) покажут нам неопределенность даваемого
прогноза.

Но это еще не вся неопределенность. Говоря о реализациях куба литологии, мы забыли про его
границы, то есть про кровлю и подошву резервуара. Недостатки детерминированной
интерполяции границ на рис. 2 тоже видны – это разная изменчивость рельефа границ вблизи и
вдали от скважин. Геостатистическая же интерполяция скважинных отметок даст нам

11
стратиграфические границы с истинной изменчивостью, но решение опять же будет
неединственным. Вместо одной детерминированной границы мы получим множество реализаций
этой границы. Соответственно, при расчете очередной реализации куба литологии мы должны
будем использовать новую реализацию геометрических границ, то есть новую реализацию
стратиграфической сетки. Точно так же мы должны будем действовать и дальше – применительно
к каждой реализации куба литологии мы рассчитаем реализацию пористости, и потом, уже в связи
с последней, реализацию проницаемости и насыщенности. В итоге, вместо одной
детерминированной модели мы будем иметь достаточно большой набор ее реализаций
(желательно несколько десятков), каждая из которых будет соответствовать скважинным данным
и иметь истинную изменчивость структурных поверхностей и свойств.

Что мы будем делать с этими реализациями? Подсчитав запасы в каждой реализации, мы сможем
подсчитать среднее значение запасов и среднеквадратичное отклонение от среднего. Последнее
даст нам очень важную оценку – точность подсчета запасов. И второе, еще более главное –
множество реализаций значительно расширит наши возможности в части адаптации модели к
данным разработки. Об адаптации модели мы будем говорить в последней главе.

Вернемся теперь к вопросу об истинной изменчивости поверхностей и свойств. Как мы


собираемся определять эту изменчивость, на глаз? Да, характер изменчивости виден на глаз
(смотрите, например, на рис. 2), но формально изменчивость характеризуется посредством
вариограммы. Что такое вариограмма, мы скоро узнаем.

Теперь, наконец, можно сказать, что такое геостатистика. Геостатистикой называют набор методов
интерполяции точечных данных, позволяющих воспроизводить в пространстве их истинную
изменчивость. Или, иначе, это набор методов интерполяции, основанных на использовании
вариограмм. Геостатистической моделью называют такую модель, в которой при расчете
структурных поверхностей и кубов свойств используются методы геостатистической
интерполяции. Соответственно, геостатистическая модель представляет собой не единственную
(детерминированную) модель, а набор равновероятных стохастических реализаций. Определение
«стохастических» указывает на то, что при расчете реализаций в определенный момент мы будем
использовать генератор случайных чисел.

Разумеется, реальный природный резервуар – он один. Но какой он – мы не знаем. Однако


геостатистика показывает нам, каким он может быть, и каким он быть не может. Он может быть
только таким, как одна из наших стохастических реализаций. И, наоборот, он не может иметь вид,
который не входит в число наших стохастических реализаций. В частности, он не может быть
таким, как детерминированная модель.

1.5. Обзор содержания курса

Как мы только что сказали, геостатистикой называют набор методов интерполяции точечных
данных, основанных на использовании вариограмм. Это не совсем так, поскольку сегодня в
геостатистику входит несколько новых методов, реализующих идею расчета стохастических
реализаций на иных основаниях, без использования вариограмм. Тем не менее, свое изложение мы
начнем с описания классической двухточечной геостатистики, основанной именно на
вариограмме.

Первая после данного Введения глава курса (глава 2) называется «Ковариация и вариограмма».
Понятие «ковариация» является в геостатистике основным. Достаточно понять, что такое

12
ковариация, как знание ковариации позволяет предсказывать поведение случайной переменной – и
после этого можно считать себя геостатистиком. В стационарном случае ковариация имеет
простую связь с вариограммой. После исходных определений мы рассмотрим, как рассчитывается
экспериментальная вариограмма и какие модели используются для ее аппроксимации. Нам важно
будет понять, какую информацию несет вариограмма сама по себе. С этой целью мы сравним
образы случайной переменной, соответствующие разным моделям вариограмм. Обсуждая эти
образы (которые и есть наши стохастические реализации) и их привязку к имеющимся точечным
данным мы проясним суть геостатистики.
После этого, в главе 3, мы выясним, что же такое «кригинг», и как он связан со стохастическими
реализациями случайной переменной. Кригинг является детерминированной интерполяцией
(дающей единственное решение) точечных данных, основанной на использовании вариограммы.
Рассматривая кригинг, мы восстановим истинную историю развития геостатистики, поскольку на
самом деле идея кригинга на двадцать лет старше идеи расчета реализаций. Дальше в главе 3 мы
выведем систему уравнений кригинга, рассмотрим его разновидности (простой, обыкновенный и
универсальный кригинг), а также возможности кригинга в части фильтрации ошибок.
В главе 4 мы рассмотрим возможности кригинга в части учета, наряду с основными точечными
данными, дополнительных пространственных данных – карт и кубов свойств. Если точечными
данными в наших моделях являются скважинные данные, то дополнительными
пространственными данными чаще всего являются данные сейсмики. Дополнительные
пространственные данные могут учитываться тремя разными способами. Первое – как тренд.
Второе – как дрейф. Третье – посредством использования их ковариации с данными скважин.
Будет рассмотрена формальная основа и особенности каждого из трех подходов.
В главе 5, соблюдая историческую последовательность, мы перейдем от кригинга к
стохастическим реализациям. Знание кригинга позволит нам рассмотреть основной алгоритм
расчета реализаций – последовательное гауссовское стохастическое моделирование. Сам по себе
названный алгоритм не сложен – сложным является обеспечение условий его корректного
применения. Обеспечить названные условия мы можем при помощи двух процедур – или
посредством разделения среды на категории пород при помощи индикаторного стохастического
моделирования, или посредством формального преобразования данных «Normal Score». Будут
рассмотрены обе названные возможности.
Материал, изложенный в главах 2-5, представляет собой логически связанный и математически
строгий классический курс геостатистики. Однако использование классической геостатистики
является допустимым лишь при выполнении весьма жесткого предварительного условия –
моделируемая среда должна быть статистически однородной. Все детерминированные
особенности среды (тренды, категории, аномальные области) должны быть предварительно
выделены и исключены.

Проблема в том, что выполнить названное условие на практике очень сложно. Те же


детерминированные особенности, которые не будут выделены, будут в реализациях стерты. Иначе
и быть не может – геостатистика исходит из того, что детерминированных особенностей в среде
нет. Именно поэтому распределения в пространстве категорий и свойств, получаемые посредством
расчета стохастических реализаций, довольно часто кажутся геологу чересчур хаотичными.

Выход из названной ситуации нашли в том, что арсенал геостатистики дополнили двумя
неклассическими (эвристическими) методами категориальной интерполяции, позволяющими
геологу жестко контролировать пространственную форму монопородных тел. Первый из этих

13
методов – объектное моделирование. Второй метод – многоточечная геостатистика. Оба этих
метода мы рассмотрим в главе 6. Идеи этих методов достаточно просты. Вариограмму они не
используют.

В заключительной части главы 6 мы рассмотрим подход под названием «Нечеткая геологическая


модель». Нечеткая модель реализует категориальную интерполяцию количественных данных.
Поскольку нечеткая модель работает с категориями, ее следует помещать рядом с индикаторным
моделированием. Однако по решаемым задачам ее легче сравнивать с методом «Normal Score».
Что мы и сделаем.

В главе 7 мы коротко рассмотрим относительно новый метод – стохастическую сейсмическую


инверсию. Идея этого метода является блестящей, однако его реализация достаточно сложна. Тем
не менее, количество успешных применений данного метода увеличивается.

В главе 8 (последней) мы сделаем самое интересное – попытаемся с помощью стохастических


реализаций адаптировать геологическую модель к истории разработки. А именно, мы рассмотрим
метод адаптации, известный под названием «множественный фильтр Калмана».

14
2. Ковариация и вариограмма
2.1. Как статистика появляется в геологии. Среднее значение и дисперсия

Как статистика появляется в геологии? Допустим, мы хотим определить значение пористости в


некоторой точке на площади (в пределах некоторого горизонта). Если у нас есть образец из этой
точки, то мы имеем совершенно определенное значение пористости P=15% (рис. 3 слева). Однако
если у нас нет образца из этой точки, то мы можем сделать следующее: представить эту
пористость как случайную переменную, и в качестве ее характеристики использовать функцию
плотности вероятностей, рассчитанную по гистограмме пористости образцов Pi, взятых на этой
площади в других местах (рис. 3 справа). Оценкой пористости в этом случае будет среднее
значение случайной переменной mP = 15% и ее дисперсия σP, что намного лучше, чем ничего.
Корень из дисперсии есть среднеквадратичное отклонение.

Среднее значение:
1
mP = E ( P ) =
N
∑P
i =1, N
i

Дисперсия:
1
σ 2P =
N
∑ (P − m
i =1, N
i P )2

Рис. 3. Оценка пористости в неизвестной точке по гистограмме пористости на всей


площади.
Выше мы впервые использовали термин «случайная переменная». Будем считать, что это такая
переменная, которая принимает определенные значения с определенными вероятностями.
Необходимо иметь в виду, что, в отличие от среднего, дисперсия сильно зависит от локального
осреднения данных. Допустим, мы рассчитываем среднее значение и дисперсию значений на
некоторой карте (рис. 4). После локального осреднения (показаны значения мощности пласта на
исходной сетке 1х1 и на укрупненных сетках с ячейками 5х5 и 10х10 от начальных) дисперсия
значений уменьшается. Это называется эффектом основания. Вследствие эффекта основания

15
дисперсия пористости по керну всегда больше дисперсии пористости, выведенной по каротажу, а
последняя, в свою очередь, всегда больше дисперсии пористости, выведенной из данных
сейсмики.

Рис. 4. Дисперсия значений зависит от локального осреднения.

2.2. Стационарность

Зададим следующий вопрос: «Всегда ли мы, делая прогноз, можем полагаться на среднее и
дисперсию?» Не всегда. Полагаться на среднее и дисперсию можно только тогда, когда случайная
переменная ведет себя везде примерно одинаково. То есть так, как это показано на рис. 5. Такое
поведение случайной переменной называется стационарным.

16
Рис. 5. Стационарное поведение случайной переменной. На среднее (красная сплошная
линия) и среднеквадратичное отклонение (две красные пунктирные линии)
полагаться можно.

Пример нестационарной случайной переменной показан на рис. 6. Можем ли мы рассчитать для


нее среднее значение и дисперсию (среднеквадратичное отклонение)? Да, можем. Но можем ли мы
положиться на это средне и эту дисперсию (среднеквадратичное отклонение)? Нет, не можем.
Очевидно, что прогноз на их основе является очень плохим – среднее значение почти всегда
находится в стороне от значений переменной, а среднеквадратичное отклонение сильно завышает
ошибку прогноза.

17
Рис. 6. Нестационарное поведение случайной переменной. На среднее (красная сплошная
линия) и среднеквадратичное отклонение (две красные пунктирные линии)
полагаться нельзя.

Однако ситуацию, изображенную на рис. 6, можно исправить. Для этого достаточно найти и
вычесть из значений случайной переменной детерминированный тренд (голубая линия). В
результате задача сводится к случаю, показанному на рис. 5, после чего точность прогноза
значительно возрастает. Названное преобразование называется приведением случайной
переменной к стационарному виду.

На рис. 7 показано стационарное и нестационарное поведение случайной переменной в случае 2D.


Это карты стратиграфических поверхностей, но точно так же могут выглядеть и карты пористости.
Важным является то, что левая карта показывает стационарное поведение переменной, а в
поведении переменной, показанной в центре, присутствует некоторая неслучайная составляющая.
Выделенный ее детерминированный тренд показан справа.

18
Рис. 7. Стационарное (слева) и нестационарное (в центре) поведение переменной в случае
2D. Картина справа показывает выделенный тренд.

Наряду с термином «стационарность» и в том же значении мы будем использовать термин


«статистическая однородность».

2.3. Первый критерий стационарности. Анализ гистограмм

Теперь зададим такой вопрос: «Можно ли отличить стационарное поведение переменной от


нестационарного не на глаз, а при помощи какого-нибудь формального критерия?» Да, можно. Не
достаточным, но очень сильным критерием является вид гистограммы значений переменной. Если
гистограмма значений похожа на распределение Гаусса, то, скорее всего, мы имеем стационарный
(статистически однородный) случай. Если гистограмма не гауссовская, то наш случай точно не
стационарный. Названный критерий используется в геостатистике постоянно.

Продемонстрируем данный критерий на примере карт, показанных на рис. 7. Гистограммы


видимых значений представлены на рис. 8. Красная кривая на рис. 8 соответствует левой карте –
гистограмма очень близка к гауссовской, то есть подтверждает стационарное поведение
переменной, воспринимаемое визуально. Синяя кривая соответствует правой картине –
гистограмма резко отличается от гауссовской, что подтверждает явно нестационарное поведение
переменной. Зеленая кривая соответствует центральной картине – гистограмма сама по себе не
позволяет уверенно идентифицировать нестационарное поведение, то есть визуальное восприятие
оказывается точнее.

19
Рис. 8. Гистограммы значений параметра, соответствующие картам, показанным на рис. 7.

Почему в качестве критерия стационарности (статистической однородности) мы используем


сравнение именно с распределением Гаусса? Чтобы объяснить это, приведем следующий пример.
Допустим, вы купили на рынке большую партию (100 кг) отборных яблок. Если вы взвесите
каждое яблоко с точностью до 1 г и построите гистограмму полученных весов, то вы получите
распределение Гаусса (рис. 9 слева). Почему? Это закон природы. Если отклонения значений от
средней величины случайны, то эти значения распределены по Гауссу.

Рис. 9. Распределение яблок по весу. Слева – выборка содержит яблоки одного сорта.
Справа – выборка содержит яблоки двух сортов.

Однако нельзя исключить, что после взвешивания яблок вы получите гистограмму другой формы,
например, двугорбую (рис. 9 справа). О чем это будет говорить? Это будет говорить о том, что вам
продали яблоки двух сортов. То есть, негауссовский вид гистограммы тех или иных значений (веса
яблок, пористости в пробах, отметок глубины некоторого горизонта и т.д.) однозначно указывает
на нестационарность – на присутствие в данных некоторого детерминированного фактора.
«Случайно» негауссовская гистограмма получиться не может.

20
Геологическая среда, как и яблоки, тоже может состоять из разных сортов (типов горных пород).
Поэтому двугорбые или иные негауссовские гистограммы свойств мы очень часто получаем
именно по причине того, что среда состоит из пород разных категорий. В этих условиях опираться
на среднее значение свойств и их дисперсию нельзя (как и в случае с трендом). Сначала
необходимо разделить среду на категории. Каждая категория будет иметь свое среднее и свою
дисперсию.

Анализ гистограмм, при всей его простоте, является очень мощным исследовательским
инструментом. И не только в геостатистике. Можно упомянуть, что именно анализ гистограмм
является весьма эффективным средством выявления фальсификаций в ходе избирательных
процедур. Искусственное вмешательство – вбросы бюллетеней, приписки – мгновенно нарушает
естественные (гауссовские) распределения показателей явки и числа голосов в пользу различных
кандидатов или партий на множестве избирательных участков.

Подведем первый итог. Мы собираемся строить геологическую модель. В ходе этого процесса мы
будем интерполировать сначала структурные поверхности, а затем значения свойств. И в первом,
и во втором случае мы будем на основе точечных (скважинных) данных прогнозировать значения
в пространстве некоторого параметра Z(x). При этом мы будем стараться воспроизвести истинную
изменчивость геологической среды, то есть наш расчет мы будем основывать на статистических
свойствах данных. Но мы только что увидели, что даже простейшим прогнозом – средним и
дисперсией – можно пользоваться только в стационарном (статистически однородном) случае.
Первым критерием стационарности является вид гистограммы известных значений параметра. (О
втором критерии мы скажем чуть позже). Если гистограмма гауссовская – наш случай, скорее
всего, стационарный, и на среднее и дисперсию полагаться можно. Если гистограмма
негауссовская – у нас точно нестационарный случай, и на среднее и дисперсию полагаться нельзя.
Во втором случае надо искать причину нестационарности. Это может быть или тренд (рис. 6), или
наличие аномальной области, или категориальный характер среды (рис. 9) – одним словом,
некоторая детерминированная черта. На среднее и дисперсию мы сможем положиться только
после того, как причина нестационарности будет выявлена и исключена.

Почему мы так много говорим о возможности использовать среднее и дисперсию? Потому, что
если мы не можем положиться на среднее и дисперсию, то и на все последующие
геостатистические прогнозы тем более положиться будет нельзя. Сейчас мы увидим, что
геостатистика добавляет к среднему и дисперсии случайной величины совсем немного, всего
только одну ее дополнительную характеристику – ковариацию.

2.4. Исходное положение геостатистики

Итак, мы пришли к тому, что прогнозируемый пространственный параметр Z(x) должен быть
представлен как сумма детерминированной части m(x) и случайного стационарного остатка R(x):

Z ( x ) = m( x ) + R ( x ) (1)

Названное представление называют исходным положением геостатистики.

Но ведь это очень бедное, невыразительное представление! Два простых слагаемых, первое –
известная детерминированная часть, и второе – стационарный случайный остаток с известным
средним и известной дисперсией. Ну и что? На чем здесь можно построить науку?

21
Дело в том, что стационарные случайные остатки, или лучше сказать переменные, даже при
одинаковом среднем и одинаковой дисперсии, могут вести себя совершенно по-разному. То есть,
помимо среднего и дисперсии, существует еще одна (третья) характеристика этих переменных,
которая позволяет их различать, подробно описывать и даже предсказывать их поведение (при
всей их случайности).

Третья характеристика, которую мы имеем в виду, называется ковариацией. Она показывает, как
резко меняется случайная переменная вокруг своего среднего и внутри коридора, определяемого
дисперсией (рис. 10). Но это мы забегаем вперед. Сначала мы напомним, что такое ковариация
двух разных случайных переменных X и Y и как она связана с коэффициентом их корреляции, а
затем покажем, как при помощи ковариации описывается пространственная изменчивость
случайной переменной Z(x).

Рис. 10. Примеры различного поведения стационарной переменной Z(x) при одинаковом
среднем и одинаковой дисперсии. Показанное различие описывается ковариацией.

2.5. Ковариация двух случайных переменных X и Y

Чтобы понять, что такое ковариация, достаточно просто прислушаться к этому слову. Это
совместная, согласованная вариация (кстати, очень похоже на слово «кооперация»). Пусть у нас
есть две случайные переменные X и Y, зависящие от координат в пространстве или во времени.
Мы хотим определить, есть ли между случайными переменными X и Y какая-нибудь связь. Мерой
этой связи является ковариация X и Y, которая обозначается Cov(X,Y). Последняя характеризует
склонность двух случайных величин одновременно (при одном значении координаты) находиться
по одну сторону от своих средних:

Cov( X , Y ) = E[( X − E ( X )) * (Y − E (Y ))] (2)

Здесь E обозначает математическое ожидание, E(X) равно среднему значению mx случайной


переменной X. Осреднение идет по всем значениям координат. Соответственно, ковариация X и Y
есть просто число, от координат она уже не зависит.

22
Если в формуле (2) случайные переменные ведут себя согласованно (допустим, обе склонны
одновременно быть или выше своих средних, или ниже), то тогда в квадратных скобках у нас
всегда будет положительная величина, которая после осреднения тоже даст величину
положительную. Если же согласованности нет, то усредняться будут знакопеременные случайные
величины, и результат будет близок к нулю.

Знание ковариации позволяет нам, используя одну случайную величину, предсказывать поведение
другой. Допустим, X есть температура воздуха в центре Москвы, измеряемая в каждый полдень, а
Y есть количество проданных в тот же день (и тоже в Москве) порций мороженного. То есть, в
каждый день года мы имеем две случайные величины. Для летних месяцев их ковариация, скорее
всего, будет значительной, поскольку в жаркие дни мороженного продается больше, а в
холодные – меньше. Используя рассчитанное (по данным за некоторое предшествующее время)
значение ковариации, директор хладокомбината сможет, ориентируясь на прогноз температуры
воздуха на предстоящий день, увеличивать или уменьшать свое суточное производство. Но только
летом. Для других сезонов никакой ковариации, скорее всего, не будет.

Однако ковариацию, определенную по формуле (2), трудно использовать, поскольку она имеет
сложную размерность. И мы не можем сразу сказать – 10000 [порций]*[градусы], это много или
мало? Для исключения названной неопределенности ковариацию нормируют на
среднеквадратичное отклонение X и Y. В этом случае она превращается в хорошо всем известный
безразмерный коэффициент корреляции ρ, который может принимать значения от -1 до 1.

Cov ( X , Y ) E[( X − E ( X )) * (Y − E (Y ))]


ρ= = (3)
σ xσ y E[( X − E ( X )) 2 ] E[(Y − E (Y )) 2 ]

Максимальная корреляция имеет место в случае, когда переменная коррелирует сама с собой, то
есть когда Y равен X. Нетрудно видеть, что в этом случае ρ становится единицей. Значение -1
получается тогда, когда отклонения случайных переменных от их средних значений точно
согласованы, но противоположны по знаку.

2.6. Ковариация случайной переменной Z(x). Вариограмма

Пусть у нас есть пространственная стационарная случайная переменная Z(x). Например, это могут
быть значения пористости на некоторой площади. Ковариацию пространственной переменной Z(x)
определяют как ковариацию двух случайных переменных – Z(x) и Z(x+h), то есть как ковариацию
переменной с ней же самой, но взятой в точках со смещением h.

Cov ( Z ( x ), Z ( x + h)) = E[( Z ( x ) − mZ ) * ( Z ( x + h) − mZ )] = C (h) (4)

Осреднение в приведенной формуле идет по всем парам точек, расстояние между которыми равно
h. Результат этого осреднения не зависит от положения пар точек в пространстве, а только от
расстояния между ними. Очевидно, что Cov(Z(x), Z(x+h)) будет иметь вид некоторой спадающей
функции от h. Максимальное значение ковариация будет иметь при h=0, и это значение, по
определению, будет равно дисперсии Z(x). С увеличением h ковариация будет уменьшаться
(согласованность поведения Z(x) и Z(x+h) будет снижаться) и, начиная с некоторого h, станет
равной нулю. Примерный график ковариации Z(x) показан на рис. 11.

23
Рис. 11. График ковариации C(h) стационарной случайной переменной Z(x).

У ковариации Z(x), которую мы определили по формуле (4), есть один недостаток – при ее расчете
необходимо знать еще и среднее значение mZ. В чем здесь проблема, ведь если у нас есть данные в
отношении Z(x), то и среднее, казалось бы, тоже есть? Дело в том, что обычно мы имеем только
среднее значение переменной в известных точках, а нам надо знать среднее значение переменной
на всей области ее определения. Последнее нам, строго говоря, неизвестно. Кроме того, опираться
на среднее мы можем лишь в стационарном случае, а стационарность надо еще доказать. Поэтому
удобнее пользоваться несколько иной характеристикой изменчивости Z(x) – так называемой
вариограммой γ(h), которая есть половина среднего квадрата разности значений в точках,
разделенных расстоянием h. Вариограмму мы можем рассчитать прямо из данных:
1
γ (h) = E{[ Z ( x + h) − Z ( x)]2 } (5)
2
Вариограмма γ(h) имеет вид возрастающей функции (рис. 12).

Рис. 12. График вариограммы γ (h) в случае стационарного поведения Z(x).

В стационарном случае график вариограммы является просто перевернутым графиком


ковариации. Действительно, возьмем определение вариограммы, прибавим и отнимем внутри
квадратных скобок среднее mz и перегруппируем члены:

24
1
γ ( h) = E{[ Z ( x + h) − mZ + mZ − Z ( x)]2 }
2
1
γ (h) = E{[ Z ( x + h) − mZ ]2 + [ Z ( x) − mZ ]2 − 2[ Z ( x + h) − mZ ][ Z ( x) − mZ ]}
2
1
γ (h) = {2C (0) − 2C (h)} = C (0) − C (h) (6)
2

2.7. Расчет экспериментальной вариограммы. Модели вариограмм

Продолжим рассматривать случайную переменную Z(x). Как мы говорили, это могут быть
значения пористости на некоторой площади. Очень важная деталь – на практике мы имеем
значения Z(x) не на всей площади, а только в некотором количестве точек (на скважинах,
рис. 13а). Можем ли мы по отдельным точкам рассчитать вариограмму? Да, можем. Вариограмму,
рассчитываемую по имеющимся (чаще всего точечным) данным, называют экспериментальной.
При ее расчете и количество пар точек, и расстояния между точками в парах являются
фиксированными. Легко показать, что если на площади у нас имеется N точек (скважин), то
количество их пар будет (N-1)*N/2. Если мы отобразим каждую пару точек в координатах
«расстояние между точками» и «половина квадрата разности значений Z в этих точках», мы
получим так называемое «облако точек вариограммы» (рис. 13б). В отношении усреднения этих
точек поступают следующим образом. Шкалу расстояний между точками разбивают на
фиксированные интервалы, после чего усредняют значения половины квадрата разности Z для
точек, попавших в один интервал. Каждое такое усредненное значение ассоциируется с центром
соответствующего интервала. Усредненные точки соединяют отрезками и полученную ломаную
линию называют экспериментальной вариограммой.

Рис. 13. Расчет экспериментальной вариограммы: а – исходные точки на площади; б –


облако точек вариограммы и усредненные значения половины квадрата разности.

Экспериментальная вариограмма дает нам очень большой объем информации о поведении


пространственной случайной переменной. Скажем больше – классическая двухточечная

25
геостатистика имеет всего два аналитических инструмента – гистограмму и вариограмму. Но с
этими двумя инструментами, как мы увидим, можно сделать очень много. Определение
«двухточечная» как раз и указывает на вариограмму. Разговор о гистограммах мы уже начали чуть
раньше. О вариограммах мы тоже будем говорить очень много.

И прежде всего, скажем следующее. Вторым по важности (но тоже недостаточным) признаком
стационарности случайной переменной Z(x) является выход ее вариограммы, начиная с некоторых
h, на «плато». Напомним, первым признаком стационарности является гауссовский вид
гистограммы значений.

Экспериментальная вариограмма может сильно отличаться от гладкой кривой, показанной ранее


на рис. 12. Особенно велики эти различия бывают при малом количестве исходных точек данных,
когда результаты усреднения в интервалах сильно разнятся. Имея это в виду, мы не придаем
изломанному виду экспериментальной вариограммы большого значения и аппроксимируем ее
гладкой кривой (рис. 14). При этом есть одна важная особенность – мы можем использовать
только такие аппроксимирующие кривые, которые входят в перечень так называемых моделей
вариограмм. Основные стационарные модели вариограмм показаны на рис. 15.

Рис. 14. Аппроксимация экспериментальной вариограммы модельной кривой.

Рис. 15. Основные стационарные модели вариограмм.

26
Почему мы должны выбирать аппроксимирующую кривую только из списка так называемых
моделей вариограмм и не можем предложить какую-то свою? Причина в том, что точки
вариограммного облака, которые мы усредняем, не автономны, а имеют взаимную связь.
Произвольная аппроксимирующая функция может потребовать наличия в вариограммном облаке
точек с отрицательной ординатой (квадратом разности). В отношении функций, представленных
на рис. 15 (и еще некоторых других) доказано, что такого противоречия быть не может (Chiles,
Delfiner, 1999). Можно также использовать линейную комбинацию разрешенных моделей с
положительными коэффициентами.

2.8. Параметры вариограммы: радиус, порог, эффект самородков, поведение вблизи нуля

После того, как мы подобрали модель к экспериментальной вариограмме, мы полагаем, что


именно эта модель характеризует пространственную изменчивость случайной переменной Z(x).
Рассмотрим модель экспериментальной вариограммы подробнее (рис. 16).

Рис. 16. Главные характеристики вариограммы: радиус R, порог C, эффект самородков С0 и


крутизна вблизи начальной точки.

На что необходимо обратить внимание? Первое, на что мы смотрим – выходит ли


экспериментальная вариограмма на «плато». Невыход вариограммы на плато означает, что
поведение переменной Z(x) в границах исследуемого участка не является стационарным. Обычной
причиной этого является наличие тренда. Тренд в поведении переменной необходимо выявить и
исключить, иначе геостатистика неприменима.

Уровень плато C называют порогом вариограммы. Как следует из выражений (4), (6), порог
вариограммы равен дисперсии значений Z(x).

27
Второе, на что мы смотрим – имеет ли вариограмма наклонный участок, или же она имеет вид
«ступеньки». На показанной вариограмме (рис. 16) наклонный участок есть. Удаление h, на
котором наклонный участок заканчивается и вариограмма выходит на плато, называют радиусом
вариограммы R. Радиус вариограммы показывает расстояние, на котором значения переменной
Z(x) становятся независимыми друг от друга.

Если наклонного участка нет и радиус вариограммы R равен нулю – то это случай
неблагоприятный. Такую вариограмму называют вариограммой «белого шума». Она говорит о
том, что значения случайной переменной даже в соседних точках никак не коррелируют друг с
другом. Геостатистика прогнозировать значения такой переменной не может. Однако чаще всего
дело обстоит так, что корреляция значений в соседних точках все-таки есть, но мы ее не видим из-
за недостаточной плотности данных. В этой ситуации мы должны найти способ повысить
плотность данных, хотя бы только локально. Для расчета вариограммы локального уплотнения
данных вполне достаточно (при условии статистической однородности Z(x)).

Если вариограмма имеет хорошо выраженный наклонный участок и последующее плато –


геостатистика применима и результат мы получим. В этом случае имеет смысл обратить внимание
на две другие особенности вариограммы – на эффект самородков и поведение вблизи нуля.

Эффектом самородков С0 называют уровень вариограммы при h равном нулю. Эффект самородков
означает, что при стремлении расстояния между точками пар к нулю, вариация значений в этих
точках стремится к некоторому ненулевому значению. Эффект самородков указывает на наличие в
данных некоррелированного случайного шума.

И последнее – о поведении вариограммы вблизи нуля. Обратите внимание – модели вариограмм


(рис. 15) отличаются друг от друга именно крутизной своих начальных участков. Эта особенность
показывает, резкими или плавными являются изменения Z(x) на расстояниях много меньших
радиуса вариограммы R. Вытекающие из этого различия в поведении Z(x) мы рассмотрим чуть
позже.

Выше мы перечислили основные особенности вариограммы достаточно формально. По сути, мы


их только назвали. Однако мы будем возвращаться к этим особенностям в разных ситуациях, и
неоднократно.

2.9. Анизотропия вариограммы. Вариограмма в пространстве 3D

Мы только что рассмотрели расчет экспериментальной вариограммы по известным точечным


данным на плане XY. Этими данными могли быть или значения пористости в скважинах, или
отметки на скважинах глубины некоторой поверхности, и т.п. Рассчитав вариограмму, мы
начинаем считать, что она описывает изменчивость случайной переменной Z(x) на всей области ее
определения.
Но надо иметь в виду следующее обстоятельство. Истинная изменчивость переменной Z(x) может
зависеть от направления. В ходе расчета вариограммы, который мы только что описали,
учитывалась только длина отрезков между точками пар, но не направления этих отрезков. При
таком подходе анизотропию Z(x) мы никогда не увидим. Поэтому полученный результат может
быть ошибочным. Если есть основания предполагать наличие анизотропии, расчет вариограмм
должен производиться раздельно по направлениям (с некоторой шириной диаграммы захвата,
рис. 17). Как правило, на плане XY определяют только два направления – направление с

28
максимальным радиусом вариограммы, и (нормальное к нему) с минимальным. При малом
количестве точек данных расчет вариограмм по направлениям может быть затруднен.

Рис. 17. Расчет экспериментальной вариограммы по выделенному направлению.


Что касается расчета вариограммы Z(x) в пространстве 3D, то очень частым является случай, когда
мы делаем это на основании скважинных данных в координатах стратиграфической сетки (hi, hj,
hk). При этом горизонтальная и вертикальная вариограмма рассчитываются раздельно –
горизонтальная по точечным данным в каждом слое сетки, а вертикальная – вдоль траекторий
вертикальных скважин (или после проектирования скважинных данных на вертикаль). Как
правило, изменчивость геологической среды по вертикали примерно в сто раз выше изменчивости
по горизонтали.

Допустим, при раздельном расчете горизонтальной и вертикальной вариограммы мы получили


следующие результаты:

Горизонтальная вариограмма описывается сферической моделью с радиусом 1000 м и порогом


0.0025:

⎛ h 2
h 2 ⎞
γ (hi , h j ) = 0.0025Sph ⎜ i
+
j ⎟
⎜ 1000 2 1000 2 ⎟
⎝ ⎠
Вертикальная вариограмма описывается сферическая моделью с радиусом 1.6 м и порогом 0.0025:

⎛ hk ⎞
γ (hk ) = 0.0025Sph⎜ ⎟
⎝ 1.6 ⎠
Выше мы использовали традиционное обозначение для сферической вариограммы:
⎛3 1 ⎞
Sph( x) = ⎜ x − x 3 ⎟ , 0 ≤ x ≤ 1,
⎝2 2 ⎠
Sph( x) = 1, 1< x

29
После этого мы можем представить вариограмму в пространстве 3D как сумму горизонтальной и
вертикальной модели. Показанную анизотропию называют «геометрической».

⎛ h 2
h 2
hk2 ⎞
γ (hi , h j , hk ) = 0.0025Sph ⎜ i
+
j
+ ⎟
⎜ 1000 2 1000 2 1.6 2 ⎟
⎝ ⎠

2.10. Априорная модель случайной переменной

Итак, если разобраться, мы сделали уже довольно много. К двум известным характеристикам
пространственной случайной переменной (среднему и дисперсии) мы добавили третью –
вариограмму. В стационарном случае вариограмма имеет однозначную связь с ковариацией.
Вариограмма (ковариация) характеризует изменчивость случайной переменной. Мы научились
рассчитывать экспериментальную вариограмму. Мы твердо знаем, что опираться на среднее и
дисперсию (и на вариограмму) мы можем только в стационарном случае. Мы также знаем
критерии стационарности, основные причины нестационарности и как нестационарный случай
свести к стационарному.

Двинемся дальше. Триаду – среднее, дисперсию и вариограмму (ковариацию) – называют


априорной моделью случайной переменной. Зададим следующий вопрос – что определяет
априорная модель сама по себе? Что мы знаем о случайной переменной, если, кроме априорной
модели, никаких других данных о ней у нас нет.

Будем отвечать по порядку. Среднее значение определяет, что случайная переменная одинаково
часто принимает значения больше или меньше указанной величины. Дисперсия определяет,
насколько далеко случайная переменная может отклоняться от своего среднего. Вариограмма
определяет, какова корреляция между значениями случайной переменной в соседних точках
пространства. Или, другими словами, насколько резко меняются значения случайной переменной
вокруг своего среднего и в коридоре, определяемом дисперсией. И все.

На рис. 18 показаны образы случайной переменной в пространстве 2D, соответствующие пяти


разным априорным моделям. Средние значения и дисперсии во всех пяти случаях одинаковы,
различаются только вариограммы.

30
Рис. 18. Реализации случайной переменной Z(x) в пространстве 2D. Средние значения и
дисперсии значений Z(x) во всех пяти случаях совпадают, различия обусловлены
только различиями вариограмм.

Первая из показанных картин соответствует вариограмме белого шума. Для геостатистики этот
случай является предельно неблагоприятным. Но и встречается он, можно сказать, только в
теории.

Следующие картины 2, 3, 4, 5 соответствуют вариограммам с одинаковым радиусом 1000 м.


Можно видеть, что пространственный размер областей с повышенными и пониженными
значениями Z(x) (красный и синий цвет соответственно) на всех этих картинах примерно одинаков
и сопоставим с радиусом вариограмм.

Однако модели вариограмм различаются, и на картинах мы это хорошо видим. Сферическая и


экспоненциальная вариограммы отходят от нуля круто – и мы наблюдаем, что переход от больших
значений к малым на картинах 2 и 3 происходит достаточно резко. Кубическая же и еще в большей
степени гауссовская вариограммы отходят от нуля плавно – соответственно, изменение значений
случайной переменной на картинах 4 и 5 происходит плавно.

То есть, мы можем ответить на наш вопрос так. Априорная модель достаточно подробно
описывает свойства значений случайной переменной, но не сами эти значения. Это означает, что
каждой априорной модели может соответствовать бесконечное число образов, типа показанных на
рис. 18. Отдельные же образы называют реализациями случайной переменной.

31
2.11. Суть геостатистики

Предположим теперь, что наряду с априорной моделью Z(x) мы имеем одну точку данных. То есть
мы знаем, что в точке x0,y0 значение Z(x0,y0) равно Z0. Что изменится в этом случае? В этом случае
из бесконечного числа реализаций мы должны оставить только те, которые в точке с координатой
x0,y0 имеют значение Z0. Таких реализаций тоже будет бесконечно много. Как они будут
выглядеть? Для модели белого шума ничего не изменится – мы просто не заметим, что все
реализации в какой-то одной точке имеют одинаковое значение. Но вот реализации с гауссовской
вариограммой будут иметь в точке x0,y0 не просто одно одинаковое значение, но и, в силу
плавности изменения Z(x), некоторое одинаковое пятно, и это будет заметно.

А если у нас будет не одна, а большее число точек данных? Множество реализаций будет «зажато»
во всех этих точках. В окрестности каждой такой точки все реализации будут иметь близкие
значения. И если точек данных будет достаточно много, общие черты в реализациях будут
преобладать. Разумеется, конкретное содержание понятия «много» зависит от соотношения
размера области и радиуса вариограммы. Для вариограммы белого шума данных никогда не будет
«много».

На рис. 19 показаны шесть реализаций Z(x), рассчитанных по гауссовской вариограмме и 20-ти


точкам данных. Обратите внимание – точки данных расположены неравномерно. Наибольшее
сходство между реализациями имеет место в области с максимальной плотностью данных, и
наоборот.

Рис. 19. Гауссовская вариограмма с радиусом 1500 м. Набор реализаций случайной


переменной Z(x), отвечающих известным значениям в 20 точках.

Вот в этом суть геостатистики. Вместо одной карты (кровли горизонта, пористости и т.п.),
построенной на основании некоторого числа точечных данных, и которая ничего не говорит о

32
своей надежности, мы получаем бесконечное число так называемых реализаций, которые (первое)
соответствуют экспериментальной вариограмме и (второе) воспроизводят значения в имеющихся
точках данных. Все эти реализации равновероятны. Реальность, разумеется, у нас одна. Какая она,
мы не знаем, но реализации показывают нам, какой она, по имеющимся данным, может быть.

По полученным реализациям мы сразу можем судить, насколько точным является наш прогноз в
той или иной области. Там, где реализации отличаются друг от друга незначительно – прогноз
точен, и наоборот. Кроме того, при помощи множества реализаций мы отвечаем на ряд очень
важных вопросов, на которые детерминированное моделирование ответить в принципе не может.
Какие это могут быть вопросы?

Например, нас интересует, связана ли локальная залежь «А» с основной частью месторождения,
или она является изолированной (рис. 20)? Чтобы ответить на этот вопрос мы считаем 100
реализаций поверхности «кровля резервуара» и смотрим, как они располагаются относительно
уровня ВНК. И видим, что 90 реализаций показывают локальную залежь как изолированную, и
только 10 – как связанную. На основании этого расчета делаем вывод о том, что с вероятностью
90% локальная залежь «А» является изолированной. В показанном примере изменчивость
реализаций кровли резервуара не очень велика потому, что наряду со скважинными данными при
ее расчете используется еще и отражающая сейсмическая граница.

33
Рис. 20. Две реализации поверхности «кровля резервуара» вместе с детерминированной
поверхностью ВНК. Вверху – локальная залежь «А» изолирована от основной части
месторождения. Внизу – локальная залежь «А» соединена с основной частью
месторождения.

Или второй вопрос – нас интересует, связаны ли коллекторские тела «А» и «В» (рис. 21)? Считаем
100 реализаций куба пористости и видим, что в 90 из них коллекторские тела связаны, а в 10 – не
связаны. На основании этого расчета делаем вывод, что с вероятностью 90% коллекторские тела
«А» и «В» связаны.

34
Рис. 21. Реализации куба пористости. Вверху – коллекторские тела «А» и «В» связаны.
Внизу – тела «А» и «В» не связаны.

Обратите внимание – первый пример касается расчета структурного каркаса геологической


модели (геостатистической интерполяции в пространстве 2D), а второй – прогноза ее свойств
(геостатистической интерполяции в пространстве 3D).

И, наконец, самое главное – подсчет запасов. Построив 100 реализаций геологической модели на
некоторой площади и подсчитав запасы нефти в каждой из них, мы получаем гистограмму запасов
(красная кривая на рис. 22). Допустим, среднее значение запасов по 100 реализациям получилось
2380 тысяч тонн. Но в Государственной Комиссии по Запасам (ГКЗ) у нас примут не эту цифру, а
меньшую, так называемую оценку P90 – 2280 тысяч тонн. Оценка P90 является более
осторожной – она означает, что с вероятностью 90% мы получим больше, чем она указывает. По
аналогии легко понять, какой смысл имеют оценки P10 и P50.

35
Рис. 22. Оценка неопределенности подсчета запасов.

Теперь представим, что мы построили на той же площади детерминированную модель, подсчитали


в ней запасы и получили то же значение, что и среднее по геостатистическим реализациям – 2380
тысяч тонн. Разумеется, никто не будет рассматривать эту цифру как абсолютно точную. Оценку
погрешности детерминированной модели производят экспертным путем. Анализируют, какова
может быть ошибка при расчете мощности продуктивного горизонта, параметра NTG, пористости
и нефтенасыщенности.

Но у экспертных оценок точности есть три недостатка. Первое – они не являются


дифференцированными в пространстве. Очевидно, что эксперт не может оценить погрешность,
например, пористости отдельно в каждом элементарном объеме модели – он дает одну оценку для
всего пласта. Второе – эксперту трудно представить, как могут сочетаться погрешности одного
параметра в разных точках пространства. И третье – еще более трудно представить, как могут
сочетаться друг с другом погрешности разных параметров. Поступают достаточно просто –
сначала повсеместно берут оптимистические значения всех параметров, а затем –
пессимистические, и смотрят различия в запасах.

Для сравнения – при расчете геостатистических реализаций оценка точности параметров модели
дифференцирована в пространстве. В частности, вблизи скважин погрешности параметров
(различия реализаций) всегда значительно меньше, чем вдали от них. Далее – реализации
показывают, как могут сочетаться погрешности (отклонения от средних значений) каждого
параметра в пространстве. Что же касается погрешностей разных параметров, то при расчете
геостатистических реализаций модели их возможные сочетания учитываются естественным путем
(в отдельных случаях для исключения противоречий принимаются специальные меры).
Отклонения одного и того же или разных параметров реализаций в ту или иную сторону от
средних значений очень часто компенсируют друг друга. В результате действия трех названных

36
факторов геостатистические реализации отличаются друг от друга значительно меньше, чем
оптимистический и пессимистический вариант детерминированной модели.

Из сказанного следует, что экспертная оценка погрешности детерминированной модели


оказывается, в сравнении с оценкой погрешности по геостатистическим реализациям, сильно
завышенной. Прогноз запасов по детерминированной модели показан на рис. 22 синей кривой (при
том же среднем).

И что в результате? Оценка P90 для детерминированной модели оказывается равной 2080 тысяч
тонн. То есть, после детерминированного моделирования ГКЗ примет у нас на 200 тысяч тонн
нефти меньше, чем после моделирования (той же площади и по тем же данным) на основе
геостатистики!

37
3. Кригинг
3.1. Что такое кригинг?

Подведем очередной промежуточный итог. Мы выяснили, что суть геостатистики в том, что
вместо одной карты или одного куба параметра, полученных в результате интерполяции точечных
данных и надежность которых нам неизвестна, мы имеем бесконечный набор реализаций – карт
или трехмерных кубов. Каждая из этих реализаций соответствует априорной модели случайной
переменной (среднему значению, дисперсии и вариограмме) и ее известным точечным значениям.
В заданных точках все реализации совпадают, но по мере удаления от этих точек отличия
реализаций друг от друга постепенно нарастают. Закон, по которому нарастают эти различия, и
предел этого нарастания определяются вариограммой. Совокупность реализаций дает нам
очевидный критерий для оценки полноты (или, наоборот, неполноты) наших данных и позволяет
судить об их достаточности (или недостаточности) для решения конкретной задачи.

Мы выяснили суть геостатистики, но ни разу не упомянули о ее главном методе – кригинге. Что


же такое кригинг и какова его роль?

Дело в том, что, изложив суть геостатистики, мы не ответили на два важных вопроса. Первый
вопрос: как нам быть, когда от нас требуют все же только одно решение? И второй вопрос: как
рассчитываются описанные реализации?

Два этих вопроса имеют один ответ – надо использовать кригинг. Кригинг это такая
детерминированная интерполяция (одна карта, один трехмерный куб параметра), относительно
которой ожидаемое отклонение реализаций минимально. Например, в некоторой точке X, Y на
плоскости или X,Y,Z в пространстве (и если это не есть точка данных) реализации дадут нам
некоторое распределение значений нашего параметра. Так вот, кригинг, по определению, имеет в
этой точке значение, относительно которого среднеквадратичное отклонение реализаций
минимально.

Если возможные значения случайной переменной в точке пространства распределены нормально,


то требуемым свойством обладает центр распределения (он же тогда есть среднее). Значения в
точке пространства, которые дают нам наши реализации, распределены именно нормально.
Отсюда следует, что кригинг совпадает с результатом осреднения реализаций.

Кригинг называют детерминированным решением, основанным на случайной модели среды (на


вариограмме). Если нам надо дать одно решение, гарантирующее минимальное отклонение от
неизвестной реальности в каждой точке пространства, то мы должны дать кригинг. Но при этом
мы должны понимать, что по своим свойствам (по гистограмме и вариограмме, то есть по
характеру пространственной изменчивости) кригинг резко отличается от реализаций.

Можно ли рассчитывать кригинг, усредняя реализации? Нет, все делается ровно наоборот. Для
расчета реализаций нужен кригинг. Но о расчете реализаций мы будем говорить значительно
позднее.

38
3.2. Вывод системы уравнений кригинга

Пусть Z(x) есть случайная функция, являющаяся случайной переменной в каждой точке x. Мы
знаем априорную модель этой функции, то есть ее ковариацию C(h). Оценку для случайной
функции Z(x0) в точке прогноза x0 (обозначим эту оценку Zk(x0), индекс k есть сокращение от
«кригинг») будем искать как взвешенное среднее от ее же значений Z(xi) в заданных точках xi, i =
1, 2,…, n, используя весовые коэффициенты λi:
n
Z k ( x0 ) = ∑ λi Z ( xi )
i =1

Рис. 23. Оценка Zk(x0). Для наглядности показан одномерный случай и только две заданные
точки, x1 и x2. При помощи коэффициентов λi минимизируется средний квадрат
разности Zk(x0) и Z(x0). (названные разности выделены красным цветом). Осреднение
идет по бесконечному числу реализаций. Показаны три реализации, отвечающие
ковариации C(h).

Неизвестные коэффициенты λi мы подберем так, чтобы оценка Zk(x0) минимизировала вариацию


(средний квадрат разности) между Z(x0) и Zk(x0). Что именно мы хотим минимизировать, поясняет
рис. 23. Рассматриваемая вариация имеет вид:

Var[ Z k ( x0 ) − Z ( x0 )] = E[( Z k ( x0 ) − Z ( x0 )) 2 ] =
= E[( Z k ( x0 )) 2 ] + 2 E[ Z k ( x0 ) * Z ( x0 )] + E[( Z ( x0 )) 2 ] = ...

Напоминаем, что математическое ожидание E рассчитывается посредством осреднения по


бесконечному числу реализаций, отвечающих ковариации C(h).

39
n n
... = E[(∑ λi Z ( xi )) ] − 2 E[(∑ λi Z ( xi )) * Z ( x0 )] + E[( Z ( x0 )) 2 ] = ...
2

i =1 i =1
n n n
... = ∑ ∑ λi λ j E[ Z ( xi ) * Z ( x j )] − 2∑ λi E[( Z ( xi ) * Z ( x0 )] + E[( Z ( x0 )) 2 ] (7 )
i =1 j =1 i =1

Прежде, чем идти дальше, вспомним определение (4) ковариации случайной функции Z(х). Для
большей наглядности запишем его для случая, когда среднее m равно нулю:

Cov ( Z ( x ), Z ( x + h)) = E[ Z ( x ) * Z ( x + h)] = C (h) ( 4a )


Есть ли разница между математическим ожиданием E в выражении (7) и математическим
ожиданием E в выражении (4а)? Да, разница есть. В первом случае осреднение идет для одной
пары точек по бесконечному числу реализаций, а во втором случае – для одной реализации, но по
бесконечному числу пар.

Однако существует так называемая эргодическая теорема, гласящая, что среднее для одной точки
по множеству реализаций (а также дисперсия для одной точки и ковариация для одной пары
точек) и среднее по множеству точек для одной реализации (а также дисперсия по множеству
точек и ковариация по множеству пар с фиксированным h) равны. Подробнее смотрите, например,
книгу Демьянов, Савельева, 2010. На основании этой теоремы мы можем записать следующее
(ниже E означает осреднение по бесконечному числу реализаций):

Cov[ Z ( xi ), Z ( x j )] = E[( Z ( xi ) − m) * ( Z ( x j ) − m)] = C ( xi , x j ) = Ci j = C (h),


Cii = C (0)

где h есть расстояние между точками xi, xj.

После этого присутствующие в (7) члены вида E[Z(xi)*Z(xj)] можно выразить через ковариацию
C(h). Из выражения (7) выводятся системы уравнений простого, обыкновенного и универсального
кригинга.

3.2.1. Простой кригинг

Простой кригинг соответствует случаю, когда функция Z(x) имеет известное среднее m, равное
нулю. (Если среднее не ноль, мы просто вычтем его из всех данных). Тогда математическое
ожидание E[Z(xi)* Z(xj)] сразу дает нам ковариацию Cij и выражение (7) для вариации приобретает
вид:
n n n
Var[ Z k ( x0 ) − Z ( x0 )] = ∑ ∑ λi λ j Cij − 2∑ λi Ci 0 + C00 (8)
i =1 j =1 i =1

Относительно каждого весового коэффициента λi вариация в точке x0 представляет собой


квадратичную функцию aλi2 + bλi + c (a>0), то есть графически выглядит как парабола, уходящая

40
вверх. Минимум параболы достигается в той точке, где ее производная равна нулю. Поочередно
дифференцируем выражение (8) для вариации по λ1, λ2,.. λn и приравниваем результат
дифференцирования к нулю:

λ1C11 + λ2C12 + ... + λn C1n − C10 = 0


λ1C21 + λ2C22 + ... + λnC2 n − C20 = 0
........................................................
λ1Cn1 + λ2Cn 2 + ... + λn Cnn − Cn 0 = 0
Мы получили систему уравнений. В матричном виде она выглядит так:

C (0) C12 ... C1n λ1 C10


C21 C (0) ... C2 n λ2 C20
* = (9)
... ... ... ... ... ...
Cn1 Cn 21 ... C (0) λn Cn 0

Эта система уравнений называется системой уравнений простого кригинга. Она определяет
искомые λ1, λ2,.. λn, необходимые для вычисления Zk(x0). Если значения наших реализаций Z(xi) в
точках данных фиксированы (обратите внимание, в ходе вывода мы этого не требовали, см.
рис. 23), то и в точке прогноза мы тоже получим фиксированное интерполированное значение.

Посмотрим на полученную систему уравнений (9). Все коэффициенты Сij нам известны. Откуда
мы их берем? Мы их снимаем с графика ковариации C(h) (рис. 12), приравнивая h к расстоянию
между точками xi и xj. Матрица коэффициентов системы уравнений зависит, таким образом,
только от C(h) и координат точек данных. Размерность матрицы коэффициентов равна числу точек
данных. Столбец же правой части зависит от координат точки прогноза. Чтобы выполнить
интерполяцию кригингом точек данных на плане XY, необходимо задать сетку на плане XY и
решить систему уравнений (9) в каждом узле сетки.

Выполним относительно полученной системы уравнений небольшое исследование. Допустим,


точка прогноза x0 совпадает с точкой данных x1. В этом случае столбец правой части системы
уравнений будет точно совпадать с первым столбцом матрицы коэффициентов. Решением такой
системы уравнений будет λ1 равно 1, а все остальные λ2,.. λn равны нулю. То есть, прогнозное
значение будет равно значению в точке данных x1, как и должно быть.

Рассмотрим второй случай. Допустим, точка прогноза x0 удалена от точек данных на


бесконечность. При этом правая часть системы превращается в столбец из нулей, и решением
системы будут все λ1,.. λn равные нулю. Следовательно, прогнозное значение в точке x0 будет
равно нулю. Это соответствует нашему исходному условию о нулевом среднем – при удалении от
точек данных на расстояние, большее радиуса вариограммы, кригинг выходит на среднее.

41
3.2.2. Универсальный кригинг

Система уравнений универсального кригинга выводится в предположении, что случайная функция


Z(x) является суммой неизвестного полиномиального тренда и остатка с нулевым средним.
Рассмотрим случай 2D, когда координата x имеет две компоненты – x, y. Сложность последующих
уравнений зависит от того, какую степень тренда мы принимаем. Для простоты уравнений
ограничимся только линейным трендом от координат x, y, то есть будем считать, что случайная
функция Z(x) имеет линейный тренд T(x) = T(x,y) = ax + by + c. Для краткости обозначим T(xi) как
Ti. Тогда математическое ожидание E[Z(xi)* Z(xj)] в выражении (7) можно представить как:

E[( Z ( xi ) * ( Z ( x j )] =
= E{[( Z ( xi ) − T ( xi ) + T ( xi )] * [( Z ( x j ) − T ( x j ) + T ( x j )]} =
= E{[( Z ( xi ) − T ( xi )] * [( Z ( x j ) − T ( x j )]} +
+ E{[( Z ( xi ) − T ( xi )] * T ( x j )} + E{T ( xi ) * [( Z ( x j ) − T ( x j )]} + E{T ( xi ) * T ( x j )} =
= C ( xi , x j ) + 0 + 0 + T ( xi ) * T ( x j ) =
= Cij + Ti * T j

В последнем выражении стоит ковариация остатка без тренда. Подставляя выведенное


математическое ожидание E[Z(xi)* Z(xj)] в выражение (7), получаем:
n n n
Var[ Z uk ( x0 ) − Z ( x0 )] = ∑ ∑ λi λ j {Cij + TiT j } − 2∑ λi {Ci 0 + TiT0 } + C00 + T0T0
i =1 j =1 i =1
Выше индекс uk обозначает «универсальный кригинг». Разделим члены, зависящие и не
зависящие от тренда:
n n n
Var[ Z uk ( x0 ) − Z ( x0 )] = F (λi ,..., λn ) + ∑ ∑ λi λ jTiT j − 2∑ λiTiT0 + T0T0
i =1 j =1 i =1
Перегруппируем члены, зависящие от тренда:
n
Var[ Z uk ( x0 ) − Z ( x0 )] = F (λi ,..., λn ) + (∑ λiTi − T0 ) 2
i =1
Относительно каждого коэффициента линейного тренда a, b, c вариация является квадратной
функцией (параболой, направленной вверх), минимум которой достигается в точке, где
производная равна нулю. Дифференцируя вариацию по параметрам a, b, c и приравнивая результат
к нулю, получаем три уравнения:

∑λ x − x
i =1
i i 0 =0
n

∑λ y
i =1
i i − y0 = 0

42
n

∑λ
i =1
i −1= 0

Обозначим эти уравнения как


ϕ1 (λi ,..., λn ) = 0
ϕ 2 (λi ,..., λn ) = 0
ϕ 3 (λi ,..., λn ) = 0
Наличие тренда приводит к тому, что коэффициенты λi должны удовлетворять этим трем
дополнительным уравнениям. Экстремум функции F(λ1, …, λn) при наличии дополнительных
условий вида ϕk(λ1, …, λn) = 0, где k = 1, 2,…,m, ищется как экстремум функции
m
F (λi ,..., λn ) + ∑ μ kϕ k (λ1 ,...λn )
k =1
Коэффициенты μk называются множителями Лагранжа (смотрите, например, Г. Корн, Т. Корн,
«Справочник по математике для научных работников и инженеров», М., 1968, стр. 320). В нашем
случае надо искать экстремум функции

F (λi ,..., λn ) + μϕ3 (λ1 ,...λn ) + μ xϕ1 (λ1 ,...λn ) + μ yϕ 2 (λ1 ,...λn )

Последовательно дифференцируем показанную функцию по λ1, λ2,.. λn и приравниваем каждый


результат к нулю:

λ1C11 + λ2C12 + ... + λn C1n + μ + μ x x1 + μ y y1 − C10 = 0


λ1C21 + λ2C22 + ... + λnC2 n + μ + μ x x2 + μ y y2 − C20 = 0
....................................................................................
λ1Cn1 + λ2Cn 2 + ... + λn Cnn + μ + μ x xn + μ y yn − Cn 0 = 0

Объединяя эти уравнения с тремя полученными ранее, приходим к искомой системе уравнений
для универсального кригинга:

43
C (0) C12 ... C1n 1 x1 y1 λ1 C10
C21 C (0) ... C2 n 1 x2 y2 λ1 C20
... ... ... ... ... ... ... ... ...
Cn1 Cn 2 ...C (0) 1 xn yn * λ1 = Cn 0 (10)
1 1 ... 1 0 0 0 μ 1
x1 x2 ... xn 0 0 0 μx x0
y1 y2 yn 0 0 0 μy y0

Некоторое внутреннее противоречие универсального кригинга заключается в том, что, хотя тренд
может оставаться неизвестным, ковариации Cij нам нужны без тренда (то есть рассчитанные после
того, как тренд исключен, или по участку, где тренда нет). Названное противоречие снимается
тогда, когда мы используем универсальный кригинг с опцией «скользящая окрестность» (см.
ниже). В этом случае решение будет лучше, если мы будем автоматически учитывать переменный
(и неизвестный) линейный тренд в пределах каждой окрестности.

3.2.3. Обыкновенный кригинг

Обыкновенный кригинг (не путать с простым кригингом) есть упрощенный вариант


универсального кригинга, когда тренд является неизвестной константой, то есть T(x,y) = c. Убирая
в (10) лишние члены, получаем систему уравнений обыкновенного кригинга:

C(0) C12 ... C1n 1 λ1 C10


C21 C(0) ... C2n 1 λ2 C20
... ... ... ... ... * ... = ... (11)
Cn1 Cn2 ... C(0) 1 λn Cn0
1 1 ... 1 0 μ 1

Обыкновенный кригинг отличается от простого тем, что нам не требуется явно указывать среднее
значение для случайной переменной Z(x). Мы уже говорили, что среднее значение случайной
переменной Z(x) не следует путать со средним значением случайной переменной Z(x) в известных
точках. Обыкновенный кригинг сам выбирает уровень, на который решение выходит при удалении
от точек данных на расстояние, большее радиуса вариограммы. Это важное его преимущество.
Также понятно, что обыкновенный кригинг не содержит того внутреннего противоречия, которое
содержит универсальный – тренд в виде T(x,y) = c не мешает нам рассчитать экспериментальную
вариограмму, а значит и ковариации Cij. По этим двум причинам именно обыкновенный кригинг
используется наиболее часто.

Проведем наше короткое исследование. Очевидно, что если точка прогноза x0 совпадает с точкой
данных x1, то прогнозное значение будет равно значению в точке данных x1. Пусть теперь точка

44
прогноза x0 удалена от точек данных на бесконечность. Чтобы получить оценку быстро, примем
еще одно упрощение – пусть вариограмма имеет вид «ступеньки». Тогда у нас, помимо
ковариаций в правой части, обнулятся еще и все недиагональные ковариации в матрице
коэффициентов. Решением будет μ = -С(0)/n и все λ1,.. λn равны 1/n. Соответственно, значение
кригинга на бесконечности будет равно среднему значению, рассчитанному по точкам данных. Но
это только если радиус вариограммы меньше расстояния между точками данных. Если радиус
вариограммы превышает расстояние между точками данных, то при определении уровня на
бесконечности точки данных будут иметь разные веса. А именно, индивидуальные веса близких
друг к другу точек будут меньше весов удаленных точек.

Как будет отличаться интерполяция одних и тех же точечных данных в зависимости от того, какой
кригинг мы применили – простой, обыкновенный, или универсальный? Ответ показан на рис. 24.
Это интерполяция поверхности по отметкам на скважинах. Там, где у нас достаточная плотность
данных, разницы не будет никакой. Отличия будут только на удалении от точек данных, большем
радиуса вариограммы, то есть главным образом в краевых областях. Простой кригинг при
удалении от скважин выходит на горизонтальный уровень, который мы ему указали. Это чревато
ошибкой – на рис. 24 мы указали уровень, который является слишком низким. Обыкновенный
кригинг при удалении от скважин выходит на оптимальный горизонтальный уровень, который он
рассчитывает сам. Универсальный кригинг при удалении от скважин выходит на оптимальную
наклонную плоскость (линейный тренд), которую он тоже рассчитывает сам.

45
Рис. 24. Интерполяция поверхности по отметкам на скважинах при помощи простого (а),
обыкновенного (б) и универсального (в) кригинга.

3.3. Скользящая окрестность

Итак, мы теперь знаем, что каждое интерполированное значение кригинга есть взвешенное
среднее от величин в известных точках. Весовые коэффициенты получаются в результате решения
системы, число уравнений в которой равно числу точек данных. Для расчета кригинга на сетке
1000х1000 необходимо решить названную систему уравнений миллион раз (минус число точек с
данными). Желая ускорить расчет, часто используют опцию «скользящая окрестность». Названая

46
опция ограничивает число участвующих в интерполяции точек данных. Чтобы точки данных
равномерно окружали точку интерполяции, используется их отбор по квадрантам.

Шиле и Дельфинер (Chiles, Delfiner, 1999) пишут о том, что радиус окрестности желательно брать
равным двойному радиусу вариограммы. Влияют на интерполируемое значение, действительно,
только точки в пределах радиуса вариограммы, но сила этого влияния зависит от исходных
данных в пределах радиуса вариограммы вокруг уже этих точек.

При использовании опции «скользящая окрестность» коэффициенты системы уравнений кригинга


приходится каждый раз (то есть для каждой точки интерполяции) пересчитывать. Если же
используется опция «глобальная окрестность» (то есть сразу все точки данных), то этого не
требуется. Во втором случае пересчету подлежит только столбец правой части. Поэтому при числе
точек данных менее тысячи (что обычно выполняется при интерполяции скважин) рекомендуется
учитывать их все одновременно. Однако, несколько забегая вперед, скажем следующее. При
расчете стохастических реализаций, когда каждая рассчитанная точка интерполяции далее
рассматривается как точка данных, без опции «скользящая окрестность» не обойтись.

3.4. Стандартное отклонение кригинга

После того, как весовые коэффициенты, минимизирующие вариацию относительно кригинга,


найдены, с их помощью можно рассчитать саму эту вариацию (средний квадрат отклонения
реализаций от кригинга). Например, можно использовать для этого выражение (8). Удвоенное
среднеквадратичное отклонение дает нам доверительный интервал, в который попадает 95%
реализаций. То есть, кригинг позволяет рассчитать не только интерполяцию, минимизирующую
ошибку, но и саму эту ошибку.

На рис. 25 показана карта поверхности и ассоциированная с ней карта среднеквадратичного


отклонения. Это та же самая поверхность, которую мы только что рассчитали посредством
обыкновенного кригинга (рис. 24б). Можно видеть, что ошибка равняется нулю в точках данных,
но по мере удаления от них она постепенно возрастает. Максимальное значение ошибки равняется
корню из дисперсии данных, и достигается она после того, как расстояние до ближайшей точки
данных начинает превышать радиус вариограммы. На карте ошибок видно, что одна из скважин не
является точкой данных – отметки уровня поверхности на ней нет, и на возможную ошибку она не
влияет.

Можем ли мы считать, что если мы прибавим к поверхности кригинга удвоенную


среднеквадратичную ошибку, и потом точно также ее отнимем (красная и две синие кривые на
рис. 26), то мы получим возможные предельные варианты нашей поверхности? Нет, не можем.
Поверхность, которую мы моделируем, не такая, как кригинг, и уж тем более не такая, как
кригинг, сдвинутый на величину возможной ошибки. Кригинг (и его границы) имеет совсем не
такую гистограмму, как значения поверхности в известных точках, и совсем не такую
вариограмму.

47
Рис. 25. Слева – карта поверхности, рассчитанной посредством обыкновенного кригинга (и
показанной ранее на рис. 24б). Справа – карта соответствующей вариации (ошибки
кригинга). Линия показывает сечение, см. далее рис. 26.

Еще раз, поскольку это важно – кригинг имеет совсем не такую вариограмму, как та, по которой
он рассчитан. Никакого противоречия здесь нет. Кригинг дает нам не поверхность, какой она
может быть, а некоторое осторожное решение, относительно которого ожидаемое отклонение
нужной нам поверхности минимально.

Рис. 26. Красная линия – поверхность, рассчитанная посредством обыкновенного кригинга.


Синие линии показывают удвоенную среднеквадратичную ошибку кригинга. Черные
линии показывают 12 стохастических реализаций. Положение сечения показано на
рис. 25.

Поверхность, которая нам нужна, может выглядеть как одна из реализаций, также показанных на
рис. 26. У каждой представленной реализации и гистограмма, и вариограмма всех ее значений

48
примерно совпадают с гистограммой и вариограммой реальной поверхности, насколько мы можем
судить по ее известным точкам. Но о реализациях мы будем говорить не сейчас, а позже.

3.5. Особенности кригинга, обусловленные моделью вариограммы

Рассмотрим теперь особенности кригинга, обусловленные моделью вариограммы. Поверхности,


полученные при прочих одинаковых условиях (одни те же точечные данные, одинаковый радиус и
порог вариограммы), но с разными моделями вариограмм, показаны на рис. 27.

Рис. 27. Поведение кригинга в окрестности точек данных. Профиль поверхности


воспроизводит профиль вариограммы.

Для наглядности рассчитанные поверхности обрезаны вертикальной плоскостью, проходящей


через точку данных с наивысшей отметкой. Что мы видим? Мы видим, что в окрестности точки
данных профиль поверхности воспроизводит профиль начального участка вариограммы (а если
точка обособлена – то профиль всей вариограммы). Наиболее плавным является отход от значения
в точке данных у кригинга с гауссовской вариограммой, а наиболее резким – у кригинга с
экспоненциальной вариограммой. Какую из показанных поверхностей мы должны использовать?
Мы должны использовать поверхность, рассчитанную по модели экспериментальной
вариограммы.

49
3.6. Перекрестная проверка

Мы только что увидели (на рис. 27), что модель вариограммы очень сильно влияет на результат
интерполяции точечных данных посредством кригинга. Однако при малом количестве точек
данных (особенно таких точек, которые позволяют рассчитать начальный участок вариограммы)
бывает так, что мы не можем выбрать модель вариограммы уверенно (рис. 28). Как в этих
условиях определить, какая интерполяция (рис. 29) лучше?

Рис. 28. При малом количестве данных подбор модели к экспериментальной вариограмме
затруднен.

Существует способ контроля качества интерполяции, который называется «перекрестная


проверка». Идея его очень проста. Имея, допустим, 100 точек данных, мы скрываем одну из них и
выполняем интерполяцию значений по 99-ти точкам. После этого мы сравниваем
интерполированное значение в скрытой точке с известным нам истинным значением в этой точке
и фиксируем ошибку интерполяции (невязку), порожденную сокрытием точки. Далее мы
возвращаем скрытую точку в число данных, но скрываем вместо нее какую-то другую и
фиксируем ошибку интерполяции уже в этой второй точке. Выполнив поочередно данную
процедуру для всех точек данных, мы получаем число невязок, равное количеству точек. Далее мы
строим гистограмму этих невязок. Поскольку ошибки интерполяции случаются как в большую,
так и в меньшую сторону, и поскольку большие ошибки случаются реже малых, мы получаем
гистограмму, похожую на распределение Гаусса с центром около нуля (рис. 30).

50
Рис. 29. Результат кригинга с гауссовской (слева) и сферической (справа) вариограммой.

Рис. 30. Результат перекрестной проверки кригинга с гауссовской (слева) и сферической


(справа) вариограммой.

Затем мы таким же способом проверяем качество интерполяции другого метода и получаем


вторую гистограмму невязок. Сравнив две гистограммы, мы можем однозначно определить, какой
метод интерполяции лучше. Это тот метод, гистограмма ошибок которого является более узкой, то
есть ошибки которого меньше, ближе к нулю. В нашем примере перекрестная проверка
показывает, что результат интерполяции с гауссовской вариограммой чуть-чуть лучше.

3.7. Почему кригинг называют оптимальной интерполяцией

Теперь самое время вспомнить одну историю. Дело было в ЦГЭ лет двадцать (или уже тридцать?)
тому назад. Геологические модели в то далекое время представляли собой наборы карт. Поскольку
карт требовалось много, и карты были очень ответственные, была поставлена задача разработать
собственную программу рисовки изолиний. Задание, как это часто в ЦГЭ бывает, поручили двум
независимым группам специалистов. Обе группы задачу решили, и в назначенный день
руководство получило сразу две программы рисовки изолиний.

51
Тестирование программ решили провести на одном и том же наборе точечных данных. Первая
программа нарисовала идеальную карту изолиний... И вторая программа нарисовала идеальную
карту изолиний... Но эти две карты оказались совершенно разными (рис. 29). В связи с этим
возникло некоторое замешательство.

Рис. 29. Карты изолиний, нарисованные двумя разными программами.

Что произошло? Сама по себе рисовка изолиний, понятно, вторичная задача, главное заключается
в интерполяции точечных данных. Неожиданно обнаружилось, что одни и те же данные можно
интерполировать по-разному. Нет, о существовании разных методов интерполяции, конечно,
знали. Неожиданностью стало то, что результаты интерполяции разными методами могут очень
сильно различаться. Этот случай интересен тем, что тут мы буквально носом уперлись в
геостатистику.

Что в этой ситуации дает нам знание геостатистики? Во-первых, благодаря геостатистике мы
знаем, как мгновенно определить, какая из двух карт лучше. Надо для каждой карты выполнить
перекрестную проверку. Та карта, для которой гистограмма ошибок будет более узкой, (допустим,
это будет карта, рассчитанная программой 1) и есть лучшая. Но из этого вовсе не следует, что от
программы 2 надо отказаться. Потому как на другом массиве точечных данных лучше (по той же
перекрестной проверке) может оказаться карта, рассчитанная именно программой 2. То есть,
геостатистика говорит нам, что у точечных данных есть некие внутренние свойства, и лучший
результат (в смысле перекрестной проверки) дает тот алгоритм интерполяции, который
оказывается адекватнее этим внутренним свойствам. В примере с двумя программами это
происходит случайно.

Кригинг называют оптимальной интерполяцией именно потому, что прежде, чем выполнять
интерполяцию, мы определяем внутренние свойства данных (рассчитываем их вариограмму) и
затем выполняем интерполяцию, опираясь на эту вариограмму. Поэтому результат перекрестной
проверки для кригинга всегда будет наилучшим. Пример с двумя программами рисовки изолиний
очень ясно показывает суть и преимущества кригинга. Когда мне необходимо дать самое краткое и
самое простое объяснение тому, что такое кригинг, я рассказываю именно эту историю.

52
Но мы должны помнить следующее. Говорить об оптимальности кригинга мы можем только тогда,
когда наши данные статистически однородны.

3.8. Кокригинг ошибок и факторный кригинг

Допустим, у нас есть две случайные переменные A(x) и B(x). Это может быть полезный параметр
и некоторая помеха, которая сопровождает его измерения. Пусть случайная переменная A имеет
вариограмму γA, а переменная B имеет вариограмму γB. Зададим вопрос – какую вариограмму
будет иметь сумма случайных переменных A(x) и B(x)?
По определению:
1
γ A+ B ( h ) = E{[ A( x + h) + B( x + h) − A( x) − B( x)]2 }
2
Мы помним, что математическое ожидание E означает осреднение для всех пар точек, расстояние
между которыми равно h. Перегруппируем усредняемые члены:
1 1
γ A+ B ( h ) = E{[ A( x + h) − A( x)]2 } + E{[ B( x + h) − B( x)]2 } +
2 2
+ E{[ A( x + h) − A( x)] * [ B( x + h) − B( x)]}
Перемножая скобки в последнем слагаемом, получим:

γ A+ B (h) = γ A (h) + γ B (h) + E{ A( x + h) * B( x + h)} +


+ E{ A( x) * B ( x)} − E{ A( x + h) * B ( x)} − E{ A( x) * B ( x + h)}
или, если A и B не коррелируют друг с другом:

γ A+ B ( h) = γ A ( h) + γ B ( h)
Что означает этот результат? Этот результат означает, что если наши данные включают некоторую
помеху, то их вариограмма будет представлять собой сумму двух вариограмм – вариограммы
полезной части и вариограммы помехи.

В чем состоит важность этого результата? Важность этого результата состоит в том, что очень
часто нам гораздо легче разделить на полезную часть и помеху не сами исходные данные, а их
вариограмму. Получив же вариограмму полезной части, мы можем выполнить интерполяцию
именно полезной части данных, не выделяя эту полезную часть из самих данных. Для этого
достаточно поставить в правую часть системы уравнений кригинга (см. например (9)) ковариацию
именно полезного сигнала.

Проиллюстрируем сказанное следующим примером. Допустим, мы имеем некоторые скважинные


данные. В нашем примере это отметки некоторой поверхности, но это могут быть и точечные
значения пористости, и значения любого другого параметра. На рис. 31 показаны отметки на
скважинах вдоль линии профиля, сама линия профиля на плане XY, а также экспериментальная
вариограмма этих данных (красная кривая).

53
Рис. 31. Экспериментальная вариограмма, модели вариограммы, результаты интерполяции.
На плане XY показана сглаженная поверхность.

Экспериментальная вариограмма до нуля не доходит, поскольку какое-то расстояние между


скважинами всегда есть. Мы можем аппроксимировать экспериментальную вариограмму
моделью, доходящей до нуля (зеленая кривая в окне вариограмм) – тогда интерполированная
поверхность точно воспроизведет значения в точках данных (зеленая линия на профильном
разрезе).

Но мы можем рассуждать и иначе. Мы можем предположить, что в наших данных присутствует


помеха, и что экспериментальная вариограмма является суммой сферической вариограммы
полезного сигнала с порогом 3.0 и вариограммы помехи в виде «ступеньки» с порогом 1.0. Решая
систему уравнений простого кригинга (9), мы будем подставлять в левую часть значения
ковариации суммарного сигнала, а в правую часть – значения ковариации полезного сигнала
(рис. 32). При этом, в отличие от простого кригинга, если точка прогноза будет совпадать с точкой

54
данных, интерполированное значение не будет воспроизводить «зашумленное» значение в той
самой точке, а будет равно некоторой сглаженной величине, рассчитанной по всей совокупности
точек данных (синяя кривая на профильном разрезе на рис. 31).

Рис. 32. Кокригинг ошибок (факторный кокригинг).

Исключение описанным образом случайной ошибки в виде белого шума (с вариограммой в виде
«ступеньки») называют кокригингом ошибок. Что бы выполнить кокригинг ошибок, достаточно
использовать при интерполяции модель вариограммы с эффектом самородков. Отношение порога
вариограммы (за вычетом эффекта самородков) к эффекту самородков можно интерпретировать
как отношение «сигнал-шум». Более сложный вариант, когда описанным образом исключается
систематическая ошибка с некоторой своей вариограммой (например, порожденная системой
наблюдений), называют факторным кригингом.

3.9. Кригинг как рабочий процесс. О корректном применении кригинга

Подведем очередной промежуточный итог. Самое необходимое из того, что надо знать о кригинге,
мы рассмотрели. Итак, кригинг – это метод интерполяции точечных данных, основанный на
случайной модели среды. Получив данные (таблицу точек), мы, прежде всего, изучаем их
гистограмму. При этом наша цель – обнаружить и по возможности исключить из данных
детерминированную составляющую (тренды, категории, аномальные области и т.п.). Пока мы это
не сделали, геостатистика не применима. Необходимый (но не достаточный) критерий отсутствия
в поведении переменной детерминированных особенностей – гауссовский вид гистограммы ее
значений в известных точках. При необходимости (и с учетом количества данных) на этом этапе
решается вопрос о разбиении области моделирования на подобласти, в которых данные можно
считать статистически однородными.

55
После гистограммы мы исследуем экспериментальную вариограмму. С помощью вариограммы мы
вторично судим о стационарности данных – вариограмма должна выходить на плато. Далее мы
должны убедиться, что вариограмма имеет наклонный участок, то есть что мы выявили масштаб
пространственной изменчивости. Если наклонного участка нет, необходимо хотя бы локально
увеличить плотность данных. Пока мы не установили, что радиус вариограммы больше нуля (и не
определили этот радиус), геостатистика не применима. Дальше, рассчитывая вариограммы по
азимутам, мы судим о наличии анизотропии. Этап заканчивается тем, что мы подбираем модель
вариограммы.

Если точек с данными больше тысячи, принимается решение в отношении скользящей


окрестности. Рекомендуется использовать окрестность с радиусом равным двойному радиусу
вариограммы.

Результатами кригинга являются интерполированная карта параметра (или куб параметра в случае
3D) и карта (куб) стандартного отклонения кригинга. Если принятая модель вариограммы
вызывает сомнения, выполняется расчет с разными моделями и оптимальное решение выбирается
на основе перекрестной проверки.

Рассчитав кригинг, мы понимаем, что он дает нам достаточно условное представление об


истинных значениях пористости на площади или о поведении структурной поверхности. При
отходе от точек данных кригинг выходит на среднее – но мы не считаем, что реальная пористость
тоже выходит на среднее! Гистограмма и вариограмма кригинга не такие, как гистограмма и
вариограмма значений в среде. Кригинг есть осторожное решение, относительно которого средний
квадрат отклонения реализаций параметра (действительно возможных значений параметра)
минимален.

Но что будет, если мы в самом начале не обратим внимания на то, что гистограмма значений
параметра в исходных точках негауссовская. Допустим, гистограмма пористости по скважинным
данным на площади в пределах некоторого горизонта окажется двугорбой – как следствие наличия
двух категорий пород. Или двугорбой окажется гистограмма отметок стратиграфической
поверхности на скважинах – как следствие разлома и вертикального сдвига одной части
поверхности относительно другой. Сможем ли мы в этих условиях рассчитать вариограмму
данных? Да, сможем, и вариограмма может получиться очень хорошей (с наклонным участком и
плато). Сможем ли мы дальше решить систему уравнений кригинга? Да, сможем, и у нас будет и
карта интерполированных значений, и карта ошибок. Но что это будет за результат? Мы знаем,
что кригинг, как только точки данных расходятся, тянется к среднему. А среднее у нас
бессмысленное! Это или несуществующая промежуточная пористость (между коллектором и
неколлектором), или столь же несуществующий промежуточный уровень поверхности (между
уровнями поднятого и опущенного участков).

А что в этом случае покажут реализации? Мы сможем рассчитать реализации? Да, сможем
(алгоритм расчета реализаций будет описан ниже). Реализации, как мы знаем, «крутятся» вокруг
кригинга в коридоре, который определяет ошибка кригинга. И именно значение кригинга
реализации принимают чаще всего (рис. 26). Если кригинг будет иметь бессмысленное значение,
то и реализации будут давать нам формально правильное, но, по сути, совершенно ложное
представление о среде.

Вот в этом все дело! Опасность некорректного применения кригинга (и геостатистики в целом)
очень велика именно потому, что никаких формальных препятствий на этом пути мы не
встречаем.

56
Подробно о реализациях мы будем говорить позже. Сейчас мы начнем новую главу, в которой
рассмотрим кригинг точечных данных с использованием вспомогательной пространственной
переменной.

57
4. Кригинг с использованием вспомогательной переменной
До сих пор мы рассматривали кригинг как средство интерполяции одних только точечных данных.
Сейчас же мы рассмотрим, как при помощи кригинга можно интерполировать точечные данные с
учетом дополнительных пространственных данных, которые мы считаем менее точными, но
которые тоже могут и должны внести свой вклад в результат. С этой ситуацией мы сталкиваемся,
например, когда интерполируем отметки кровли резервуара на скважинах с учетом близлежащей
сейсмической поверхности (рис. 33). Или это может быть задача в пространстве 3D – например,
интерполяция скважинных значений пористости с учетом куба сейсмического импеданса.

Рис. 33. Отметки кровли резервуара на скважинах и сейсмическая поверхность (карта и


линия на вертикальном слайсе).

58
Учесть в процессе интерполяции дополнительные пространственные данные можно тремя
способами:
• использовать пространственные данные как тренд;
• использовать пространственные данные как дрейф;
• выполнить кокригинг точечных и пространственных данных.

Что касается первого способа, то как работать с трендом мы уже говорили. Правда, мы не
говорили, что в качестве тренда можно брать сейсмическую поверхность. В чем здесь
особенность? Необходимо все-таки убедиться, что после вычета тренда гистограмма
интерполируемых значений является гауссовской. Далее мы интерполируем не сами отметки на
скважинах, а их невязки с поверхностью тренда. После интерполяции невязок прибавляем тренд к
результату. На этом о тренде – все. А вот о «дрейфе» и о «кокригинге» мы поговорим подробнее.

4.1. Кригинг с внешним дрейфом (КВД)

Давайте вспомним универсальный кригинг. При интерполяции поверхности по точечным данным


мы предположили, что в данных есть тренд в виде некоторой наклонной плоскости
T ( x ) = T ( x, y ) = ax + by + c
Но мы этот тренд не искали. Мы вывели систему уравнений, которая позволяет кригингу самому
подобрать коэффициенты a, b и c так, чтобы сделать вариацию (7) минимальной. Обратите
внимание – в результате решения системы уравнений (10) коэффициенты a, b и c мы не получили,
но мы получили результат кригинга с включенным трендом (рис. 24в). При удалении от точек
данных кригинг выходит на этот тренд.

Кригинг с внешним дрейфом (КВД) очень похож. Мы берем некоторую известную нам
поверхность S(x,y) и предполагаем, что в наших точечных (скважинных) данных есть тренд в виде
T ( x ) = T ( x, y ) = a0 + a1S ( x, y ) (11)
Далее мы точно так же выводим систему уравнений, которая позволяет кригингу самому
подобрать коэффициенты a0, a1 так, чтобы сделать вариацию (7) минимальной. В результате
решения системы уравнений коэффициенты a0, a1 мы не получим, но мы получим результат
кригинга с включенным дрейфом. То есть, при удалении от точек данных кригинг будет выходить
на тренд вида (11).

Отличие дрейфа от тренда показано на рис. 34. Дрейф, в сравнении с трендом, дает кригингу
больше свободы – кригинг может менять его уровень и его амплитуду. Отличия дрейфа от тренда
очень важны вот в каком контексте. Коэффициенты a0, a1 можно интерпретировать как
коэффициенты пересчета отражающей сейсмической поверхности из временного масштаба в
глубинный. А именно, коэффициент a1 можно трактовать как эффективную скорость
сейсмических волн, а коэффициент a0 - как статическую поправку. Это позволяет брать
поверхность S(x,y) непосредственно из временного сейсмического куба. Использование же КВД с
опцией «скользящая окрестность» позволяет учитывать изменения эффективной скорости на плане
XY. То есть, опираясь (первое) на скважинные данные в отношении глубины рассматриваемой
поверхности и (второе) на сейсмическую карту этой поверхности во временном масштабе, кригинг
самостоятельно выполняет скоростной анализ среды.

59
Рис. 34. Отличие дрейфа от тренда. Внимательному читателю поясним, что «дыры» в
сейсмической поверхности устранены посредством ручной редакции.

Что нам осталось? Нам осталось вывести систему уравнений кригинга с внешним дрейфом.
Названный вывод производится аналогично выводу уравнений универсального кригинга. Отличие
состоит только в том, что надо дополнительно минимизировать вариацию не по коэффициентам
линейного тренда, а по коэффициентам a0, a1. Выпишем только отличающиеся фрагменты:

Дифференцируя вариацию по параметрам a0, a1 и приравнивая результат к нулю, получаем два


дополнительных уравнения:
n

∑ λ S(x ) − S(x ) = 0
i =1
i i 0

∑ λ −1 = 0
i =1
i

Обозначим эти уравнения как


ϕ1 (λi ,..., λn ) = 0
ϕ 0 (λi ,..., λn ) = 0

Результирующая система уравнений имеет вид:

60
C (0) C12 ... C1n 1 S ( x1 ) λ1 C10
C21 C (0) ... C2 n 1 S ( x2 ) λ2 C20
... ... ... ... ... ... ... ...
(12)
Cn1 Cn 2 ... C (0) 1 S ( xn ) * λn = C n 0
1 1 ... 1 0 0 μ0 1
S ( x1 ) S ( x 2 ) ... S ( x n ) 0 0 μ1 S ( x0 )
Но обратите внимание – как и в случае универсального кригинга, ковариации Cij в этих уравнениях
должны быть без дрейфа (то есть рассчитанные после того, как дрейф исключен, или по участку,
где дрейфа нет).

Проведем наше традиционное экспресс-исследование. Очевидно, что если точка прогноза x0


совпадает с точкой данных x1, то прогнозное значение будет равно значению в точке данных x1.
Получить асимптотику решения на бесконечности, даже когда вариограмма имеет вид
«ступеньки», мне не удалось. Может быть, у вас получится. Чтобы понять, как ведет себя решение,
пришлось сделать еще большее упрощение – оставить только две точки данных, x1 и x2. Решение
системы в этом случае имеет следующий вид:

S ( x0 ) − S ( x 2 ) S ( x1 ) − S ( x0 )
λ1 = , λ2 =
S ( x1 ) − S ( x 2 ) S ( x1 ) − S ( x 2 )

Z ( x 2 ) S ( x1 ) − Z ( x1 ) S ( x 2 ) Z ( x1 ) − Z ( x 2 )
Z ( x0 ) = + S ( x0 )
S ( x1 ) − S ( x 2 ) S ( x1 ) − S ( x 2 )
Мы видим, что решение воспроизводит дрейф S(x) с коэффициентом, зависящим от соотношения
масштабов изменений Z(x) и S(x).

4.2. Кросс-ковариация

Давайте вспомним логику наших рассуждений о ковариации. Понятие «ковариация» мы ввели на


примере двух случайных переменных Z1(x) и Z2(x). Мы сказали, что посредством ковариации
будем характеризовать склонность этих переменных одновременно (при одном значении
координаты x) находиться по одну сторону от своих средних:

Cov[ Z1 ( x ), Z 2 ( x )] = E{[ Z1 ( x ) − m1 ][ Z 2 ( x ) − m2 ]}
Ковариация двух случайных переменных есть просто число. Ковариация (если она имеет место)
позволяет предсказывать значение одной переменной по известному значению другой.
Ковариация, нормированная на среднеквадратичное отклонение Z1 и Z2, есть безразмерный
коэффициент корреляции. Это был наш первый шаг.

61
Потом мы сказали, что если в качестве второй переменной Z2 брать ту же самую первую
переменную Z1, но в точках с некоторым смещением h, то можно рассчитать уже не число, а
некоторую функцию ковариации C(h):

C (h) = Cov[ Z1 ( x ), Z1 ( x + h)] = E{[ Z1 ( x ) − m1 ][ Z1 ( x + h) − m1 ]}


Ковариация C(h) показывает, насколько резко меняется переменная Z1 при изменении x. Знание
ковариации позволяет нам предсказывать поведение случайной переменной Z1(x) в точках,
соседних с известными, то есть наилучшим образом интерполировать точечные значения Z1(x).
Это был наш второй шаг.

Третий шаг, который мы сейчас сделаем, просто совмещает два предыдущих. Мы рассмотрим
ковариацию двух разных случайных переменных, взятых в точках со смещением h:

C 12 (h) = Cov[ Z1 ( x ), Z 2 ( x + h)] = E{[ Z1 ( x ) − m1 ][ Z 2 ( x + h) − m2 ]}


Показанную функцию называют кросс-ковариацией случайных переменных, Z1(x) и Z2(x). Она
выглядит примерно так же, как функция ковариации. С одним отличием. Если максимальное
значение ковариации (после нормировки на дисперсию) равно единице, то максимальное значение
кросс-ковариации (после нормировки на среднеквадратичные отклонения Z1(x) и Z2(x) ) равно
коэффициенту корреляции Z1 и Z2 (рис. 35).

Рис. 35. Ковариация Z1 и кросс-ковариация Z1 и Z2. ρ – коэффициент корреляции Z1 и Z2.

62
4.3. Совместный кокригинг

Допустим, у нас есть две случайные переменные, Z1(x) и Z2(x), которые коррелируют друг с
другом. Наличие корреляции Z1(x) и Z2(x) означает, что наряду с ковариацией C1(h) переменной
Z1(x) мы имеем кросс-ковариацию C12(h) переменных Z1(x) и Z2(x). В этом случае при
интерполяции кригингом точечных данных Z1(x) можно дополнительно использовать данные
Z2(x).

Вспомним, как мы выводили систему уравнений кригинга (пункт 3.2). Будем действовать точно
так же, но используя еще и значения случайной переменной Z2(x). Оценку для случайной функции
Z1(x0) в точке прогноза x0 (обозначим эту оценку Zcok(x0), индекс cok есть сокращение от
«кокригинг») будем искать как взвешенное среднее от значений Z1(xi) и Z2(xj) в точках,
соответственно, xi, i = 1, 2,…, n, и xj, j = 1, 2,…, m. Весовые коэффициенты обозначим как λi и μj:

n m
Z cok ( x0 ) = ∑ λi Z1 ( xi ) + ∑ μ j Z 2 ( x j )
i =1 j =1
Решение относительно коэффициентов λi и μj, обеспечивающее минимум вариации

Var[ Z cok ( x0 ) − Z1 ( x0 )] = E[( Z cok ( x0 ) − Z1 ( x0 )) 2 ] = min

называется «кокригинг».

Переменная Z2(x) обычно представляет собой сейсмический параметр, и мы можем взять ее хоть в
миллионе точек. Однако, поскольку Z2(x) меняется очень плавно, то, кроме усложнения системы
уравнений кокригинга (мы помним, что каждая точка добавляет одно уравнение), это нам мало что
даст. Поэтому мы поступим иначе. При оценке Zcok(x0) мы будем брать вторую переменную только
в одной точке x0, то есть именно в той точке, в которой мы делаем прогноз:

n
Z cok ( x0 ) = ∑ λi Z1 ( xi ) + μ Z 2 ( x0 )
i =1

Это важное упрощение получило название «совместный кокригинг».

Попробуем вывести систему уравнений совместного кокригинга. Действуем так же, как и при
выводе системы уравнений простого кригинга. Применяем те же обозначения. Подставляя
выражение для Zcok(x0) в выражение для вариации, получим:

Var[ Z cok ( x 0 ) − Z1 ( x 0 )] =
n m n n
= ∑∑ λi λ j C + μ C1
ij
2 2
00 +C 1
00 + 2∑ λi μC 12
i0 − 2∑ λi C 1i 0 − 2μC 12 00
i =1 j =1 i =1 i =1

Здесь С1 обозначает ковариацию Z1(x), С2 – ковариацию Z2(x) , С12 – кросс-ковариацию Z1(x), Z2(x).
Условием минимума вариации является равенство нулю производной по каждому коэффициенту

63
λi, μ. Поочередно дифференцируем выражение для вариации по λ1, λ2,.. λn, μ и приравниваем
результат каждого дифференцирования к нулю. В результате получаем систему уравнений:

λ1C 111 + λ2C 112 + ... + λnC 11n + μC 1210 − C 110 = 0


λ1C 121 + λ2C 122 + ... + λnC 12 n + μC 12 20 − C 120 = 0
...........................................................................
λ1C 1n1 + λ2C 1n 2 + ... + λn C 1nn + μC 12 n 0 − C 1n 0 = 0
λ1C 1210 + λ2C 12 20 + ... + λn C 12 n 0 + μC 2 00 − C 12 00 = 0
Ее же можно записать в матричном виде:

C1 (0) C112 ... C11n C1210 λ1 C110


C121 C1 (0) ... C12n C1220 λ2 C120
... ... ... ... ... * ... = ... (13)
C1n1 C1n2 ... C1 (0) C12n0 λn C1n0
C1210 C1220 ... C12n0 C 200 μ C1200

Эта система уравнений определяет искомые λ1, λ2,.. λn, μ. Можно видеть, что ковариация
переменной Z2(x) нам не понадобилась, нам оказалась нужна только ее дисперсия С200.

Выполним относительно полученной системы наше обычное исследование. Допустим, точка


прогноза x0 совпадает с точкой данных x1. В этом случае столбец правой части системы уравнений
будет точно совпадать с первым столбцом матрицы коэффициентов. Решением такой системы
уравнений будет λ1 равно 1, а все остальные λ2,.. λn, μ равны нулю. То есть, прогнозное значение
воспроизведет значение в точке данных x1, как и должно быть.

Рассмотрим противоположный случай. Допустим, точка прогноза x0 удалена от точек данных на


бесконечность. В этом случае все значения ковариации С1i0 и С12i0 обращаются в ноль:

C1 (0) C112 ... C11n 0 λ1 0


C121 C1 (0) ... C12n 0 λ2 0
... ... ... ... ... * ... = ...
C1n1 C1n2 ... C1 (0) 0 λn 0
0 0 ... 0 C 200 μ C1200

64
После этого решение системы становится очевидным:
12
C00
λ1 = λ2 = ... = λn = 0, μ= 2
C00

То есть, на удалении от точечных данных в отношении Z1(x) кокригинг определяется переменной


Z2(x):
12
C00 σ
Z cok ( x ) = Z 2 ( x ) 2 = Z 2 ( x ) Z 1 ρ (14)
C00 σZ2
Здесь σz1 и σz2 среднеквадратичные отклонения Z1(x) и Z2(x), а ρ – их коэффициент корреляции.
Обратите внимание, правая часть (14) у нас получилась как произведение трех сомножителей – Z2,
σz1 /σz2 и ρ.

4.4. Выводы в отношении кригинга с использованием вспомогательной переменной


Асимптотика (14) позволяет нам сделать обобщающие выводы. Мы рассмотрели три возможности
использования вспомогательной (сейсмической) переменной при кригинге точечных
(скважинных) данных. А именно, вспомогательная переменная может использоваться как тренд
(первое), как дрейф (второе) и на основе кросс-ковариации с основной переменной (третье). В чем
разница между этими решениями?
Там, где у нас высокая плотность скважинных данных, разницы не будет никакой. Отличия будут
только на значительном удалении от скважинных данных. Значительным мы называем удаление,
которое приближается, а затем начинает превышать радиус вариограммы.
Если мы используем вспомогательную переменную Z2(x) как тренд, то решение на значительном
удалении от скважинных данных будет выходить на этот тренд. То есть решение будет вести себя
как первый сомножитель в правой части (14). Обыкновенный кригинг добавит к тренду Z2(x)
некоторое постоянное смещение.
Если мы будем использовать вспомогательную переменную Z2(x) как дрейф, то решение (при тех
же условиях) будет вести себя как произведение первого и второго сомножителя в правой части
(14). То есть КВД не принимает тренд безусловно, а умножает его на соотношение масштабов
изменений Z1(x) и Z2(x).
И, наконец, если мы будем использовать вспомогательную переменную Z2(x) на основе ее кросс-
ковариации с Z1(x), то решение будет вести себя как произведение всех трех сомножителей в
правой части (14). То есть, в этом случае доверие к вспомогательной переменной обуславливается
не только соотношением масштабов изменений, но и реальной корреляцией Z1(x) и Z2(x). Первое
использование кокригинга для картирования пористости на основании скважинных и
сейсмических данных было сделано в ставшей классической работе Филиппа Дойена (Doyen,
1988).
Нам остается только повторить замечание Оливье Дюбрула (O. Dubrule, 2003). КВД чаще
используется при интерполяции структурных поверхностей, когда мы имеем все основания
полагаться на времена отражающих горизонтов. Кокригинг же чаще используется при
интерполяции свойств, когда связь прогнозируемого параметра и данных сейсмики не столь
надежна.

65
5. Стохастические реализации
Перед тем, как сделать очередной шаг, резюмируем коротко наши достижения. В главе 2 мы
выяснили суть геостатистики. Параметр геологической среды (в случае 2D это структурная
поверхность, в случае 3D это куб пористости и т.п.) мы представляем в виде случайной
переменной. Эту переменную мы разделяем на детерминированную часть и случайный
стационарный остаток. Стационарный остаток мы характеризуем при помощи среднего значения,
дисперсии и вариограммы. Вариограмму остатка мы рассчитываем по известным точечным
значениям и аппроксимируем разрешенной моделью. После этого мы полагаем, что наиболее
адекватным представлением рассматриваемой случайной переменной (ее стационарной части)
будет бесконечный набор реализаций, каждая из которых отвечает вариограмме и воспроизводит
значения в известных точках. Реальный параметр (мы так считаем) совпадает с одной из этих
реализаций, мы только не знаем, с какой именно. Эти реализации позволяют нам давать ответы на
очень важные практические вопросы (какие вопросы – повторять не будем).

Теперь мы знаем (после глав 3 и 4), что такое кригинг. Кригинг, по определению, это такое
детерминированное решение, от которого среднеквадратичное отклонение реализаций
минимально. Кригинг является оптимальным, когда нам надо дать одно единственное решение.
Кроме того, мы знаем, как рассчитать кригинг, как рассчитать ошибку кригинга, насколько
широкие возможности имеет кригинг в части исключения случайных (и систематических) ошибок,
а также в части учета сейсмических данных.

Чего мы пока не знаем? Мы пока не знаем, как рассчитываются реализации. Мы также не знаем, с
какими проблемами мы сталкиваемся при расчете реализаций. Именно об этом мы будем говорить
в данной главе.

5.1. Метод последовательного гауссовского стохастического моделирования (ПГСМ)

Наиболее известным методом расчета реализаций непрерывного параметра является


последовательное гауссовское стохастическое моделирование (ПГСМ). Метод ПГСМ впервые
предложен в работе Deutsch and Journel, 1992.

Рассмотрим алгоритм ПГСМ. Для большей наглядности будем считать, что моделирование
производится на двумерной сетке. В трехмерном случае все делается точно так же.

Итак, мы считаем, что в некоторых ячейках сетки мы имеем известные значения непрерывного
параметра (рис. 36). Пусть это будет пористость, а известные значения – это значения в скважинах.
Далее, когда мы будем говорить «точка на сетке», мы будем иметь в виду центр ячейки.

66
Рис. 36. Последовательный обход ячеек сетки по случайной траектории.

Алгоритм ПГСМ состоит в следующем. Мы последовательно обходим точки на сетке (те, в


которых у нас нет значений) по случайной траектории. В каждой очередной точке мы
рассчитываем значение кригинга и стандартное отклонение кригинга, используя для этого
значения в известных точках (рис. 37а). Далее мы строим распределение Гаусса с центром,
соответствующим полученному значению кригинга, и стандартным отклонением, равным
полученному стандартному отклонению (рис. 37б). То есть мы определяем, какие значения и с
какими вероятностями наш параметр может иметь в этой точке. Затем мы реализуем эти
вероятности – случайным образом выбираем из этого распределения некоторое значение
(рис. 37в). Вот это выбранное случайно значение мы и заносим в рассматриваемую точку
(рис. 37г). Помещенное в точку (в ячейку) значение присоединяется к числу известных данных, то
есть получает статус «значение в скважине». После этого на сетке выбирается следующая
случайная точка, которая не должна совпадать ни с одной из уже определенных. Для новой точки
все повторяется, но с одним изменением – в расчете кригинга участвует уже на одну точку
больше, чем на предыдущем шаге. После того, как мы заполняем значениями все ячейки сетки,
расчет реализации считается завершенным.

67
Рис. 37. Расчет реализации методом ПГСМ: а – значение кригинга и удвоенного
стандартного отклонения; б – распределение возможных значений; в – интегральное
распределение, выборка при помощи случайных чисел, равномерно распределенных
на интервале [0, 1]; г – значение, определенное посредством случайной выборки.

Расчет следующей реализации начинается с того, что мы оставляет на плане (как и в начале
предыдущего расчета) только истинные исходные значения. После этого мы выбираем новую
случайную траекторию обхода точек. Понятно, что при повторном обходе новые значения во всех
точках, кроме точек с исходными данными, будут отличаться от предыдущих. То есть, вторая
реализация будет отличаться от первой. Всего, таким образом, мы должны рассчитать достаточно
большое число реализаций, например 100. Чтобы представить, насколько сильно реализации могут
отличаться друг от друга, достаточно рассчитать две.

Почему мы считаем, что вариограмма значений рассчитанных таким образом реализаций будет
совпадать с вариограммой данных? Потому, что следуя описанному алгоритму, мы просто
выбираем нужную нам реализацию из бесконечного числа, изначально соответствующих заданной
вариограмме. Процесс этого выбора можно пояснить с помощью рис. 38. На исходной картине
показаны реализации, проходящие через известные точки. Мы выбираем новую точку, определяем
в ней значение кригинга и его стандартное отклонение σ, после чего случайным образом выбираем
значение в новой точке и оставляет только те реализации, которые принимают в ней именно
выбранное значение. Таких реализаций будет тоже бесконечное число, но отличаться друг от
друга они будут уже меньше. Потом мы возьмем следующую точку, определим значение в ней и
так до тех пор, пока различия между реализациями не станут бесконечно малыми.

68
Рис. 38. Расчет одной конкретной реализации можно представить как постепенное сужение
исходного бесконечного множества реализаций, соответствующих вариограмме γ(h).

В заключение сделаем два замечания. Если мы рассчитываем реализации на сетке 100х100 узлов,
то ближе к концу нам придется решать систему уравнений кригинга со многими тысячами точек
данных (то есть со многими тысячами уравнений). В пространстве 3D число точек данных будет
еще большим. Поэтому при расчете реализаций обязательно используется опция «скользящая
окрестность» с ограничением по числу учитываемых (ближайших) точек. И второе. Если у нас
есть дополнительные данные – карта или куб значений вспомогательной переменной и функция
кросс-ковариации (кросс-вариограмма) основной и вспомогательной переменной, то мы можем
рассчитывать реализации посредством решения системы уравнений совместного кокригинга (13).
При этом отличия реализаций друг от друга будут меньше, и все они будут коррелировать с
картой или кубом вспомогательной переменной.

5.2. Кригинг и стохастические реализации в пространстве 2D. Методика анализа качества


интерполяции

На рис. 39 показаны две возможности интерполяции поверхности по одним и тем же точечным


(скважинным) данным. Слева показан результат, полученный посредством кригинга, справа – одна
из стохастических реализаций. Кригинг, по сравнению с реализацией, сильно сглажен. На рис. 40
показаны соответствующие гистограммы и вариограммы. Обратите внимание – гистограмма
кригинга значительно уже гистограммы данных (дисперсия кригинга меньше дисперсии данных).
Так и должно быть, поскольку кригинг увеличивает частоту средних значений. Вариограмма
кригинга имеет больший радиус в сравнении с моделью вариограммы данных, то есть той
вариограммой, по которой он сам рассчитан. И второе – порог у вариограммы кригинга
значительно ниже порога вариограммы данных, поскольку порог равен дисперсии. Но, повторим,
никакого противоречия здесь нет. Цель кригинга не в том, чтобы воспроизвести гистограмму и
вариограмму исходных данных, а в том, чтобы обеспечить минимум вариаций. А вот гистограмма
и вариограмма реализации воспроизводит (насколько это возможно) гистограмму и вариограмму
данных (рис. 40). Потому мы и говорим, что именно реализации, а не кригинг, показывают нам
реальную среду.

69
Рис. 39. Стратиграфическая поверхность, рассчитанная по отметкам на скважинах и данным
сейсмики. Слева – интерполяция кригингом, справа – одна из реализаций.

Рис. 40. Слева: гистограмма невязок отметок на скважинах и сейсмической поверхности,


гистограмма отклонений кригинга от сейсмической поверхности, гистограмма
отклонений реализации от сейсмической поверхности. Справа: экспериментальная
вариограмма невязок отметок на скважинах и сейсмической поверхности,
вариограмма отклонений кригинга от сейсмической поверхности, вариограмма
отклонений реализации от сейсмической поверхности. Светло-зеленая линия –
сферическая модель вариограммы данных, по которой рассчитывался кригинг и
реализации.

Данный расчет является важным примером в методическом плане. Результат любой интерполяции
мы оцениваем по трем критериям. Первое – насколько хорошо на плане (или в объеме)
воспроизводятся исходные точечные данные. Второе – насколько хорошо на плане (или в объеме)
воспроизводится гистограмма точечных данных. И третье – насколько хорошо на плане (или в

70
объеме) воспроизводится вариограмма точечных данных. Рассчитанная реализация поверхности
(рис. 39 справа) устраивает нас по всем трем критериям.

Замечание. При расчете гистограммы скважинных данных часто рекомендуют использовать


опцию «декластеризация». Последняя означает, что данные каждой скважины следует брать с
весовым коэффициентом, пропорциональным площади, приходящейся на соответствующую
скважину. При этом скважины, удаленные от других, вносят в расчет гистограммы намного
больший вклад. Мы не рекомендуем использовать названную опцию, поскольку она противоречит
нашему базовому предположению о статистической однородности среды.

Описанную выше методику анализа качества интерполяции мы будем применять постоянно. И мы


увидим, что так удачно (как в примере на рис. 40) все складывается далеко не всегда.

5.3. Исходные данные примера в пространстве 3D. Детерминированная интерполяция в


пространстве 3D

Следующая наша задача – показать особенности геостатистической интерполяции в пространстве


3D. На протяжении нескольких параграфов (и даже глав) мы будем рассматривать один и тот же
пример – фрагмент реальной площади в Западной Сибири, включающий 198 скважин
(Ковалевский, Перепечкин, 2011). При этом, чтобы не отвлекаться от главного, мы будем
обсуждать в этом примере только интерполяцию свойств, но не поверхностей. То есть, наше
исходное состояние – мы имеем пространственную стратиграфическую сетку и значения
скважинного параметра в ячейках, которые лежат на траекториях скважин. На основании этих
данных мы будем рассчитывать значения параметра во всех ячейках нашей сети.

Какой скважинный параметр мы будем интерполировать? Мы будем интерполировать значения


каротажного параметра APS (альфа-ПС). Параметр APS удобен для демонстрации методов
интерполяции потому, что он имеется вдоль всей траектории скважины, в отличие от пористости,
которая рассчитывается только в пределах коллектора.

Замечание. В названной постановке мы опускаем вопрос об осреднении каротажного параметра


APS в пределах ячеек на траекториях скважин. Проблема осреднения в пределах ячеек существует,
но останавливаться на ней мы не будем. На ошибку, ассоциированную с осреднением каротажного
параметра в пределах ячеек, пока закроем глаза.

В разделе 3.7 мы уже упоминали о том, что существует (и широко применяется) множество
методов интерполяции, не имеющих никакой связи с геостатистикой. На рис. 41 показан результат
так называемой «весовой» интерполяции скважинных значений APS.

71
Рис. 41. Размещение скважин на площади, каротажные кривые APS и результат их
«весовой» интерполяции в объеме среды. Куб интерполированных значений показан
в условиях палеореконструкции. На вертикальном слайсе отмечены индексы
стратиграфических горизонтов. Красный цвет палитры примерно соответствует
песчаникам, зеленый – глинам.

Формально весовая интерполяция описывается выражением (15):

n
1
∑R
i =1
2
Z ( xi )
Z ( x0 ) = n
i
(15)
1

i =1 Ri
2

Здесь x0 – точка интерполяции в пространстве 3D, Z(xi) – значение параметра в точке данных xi,
Ri – расстояние между точкой интерполяции x0 и точкой данных xi, n – число точек данных. Суть
этой интерполяции проста – ближние точки влияют на интерполированное значение сильнее,
дальние точки – слабее. В случае совпадения точки интерполяции с точкой данных (в пределе), вес
последней устремляется в бесконечность, и результат интерполяции совпадает со значением
именно в этой точке. При удалении точки интерполяции на бесконечность (в пределе), веса всех

72
точек становятся одинаковыми, и результат интерполяции совпадает со средним арифметическим.
Можно также модифицировать решение – брать расстояния в степенях, отличных от двойки,
ограничивать число влияющих точек, вводить регуляризацию (сглаживание), дополнительно
учитывать анизотропию по направлению. Например, можно учесть анизотропию по
вертикальному и горизонтальному направлению. Для этого расстояние R между точками следует
представить как сумму (то есть корень из суммы квадратов) вертикальной и горизонтальной
составляющих, и вертикальную составляющую, для повышения ее значимости, умножить на
коэффициент анизотропии k. Допустим, k=100. Даже после названных усложнений весовая
интерполяция остается простой и понятной.

Сделаем небольшое уточнение. Интерполяция, показанная на рис. 41, является не трехмерной, а


«квазитрехмерной». Это означает, что она рассчитана посредством двухмерной интерполяции в
каждом слое ячеек стратиграфической сетки. В нашем кубе таких слоев 170. Выбор
квазитрехмерной интерполяции следует из характера исходных данных. Поскольку скважинные
данные по вертикали являются «сплошными», их вертикальная интерполяция (пока мы не начали
рассчитывать стохастические реализации) не нужна.

На первый взгляд полученное решение (рис. 41) выглядит вполне удовлетворительно. Оно точно
воспроизводит исходные данные и разумно интерполирует их в межскважинном пространстве. В
частности, мы сразу видим область повышенных значений APS в пределах горизонта AV3,
предположительно – погребенное русло. Однако для более глубокой оценки результата
интерполяции мы (следуя нашей методике) должны выполнить анализ гистограмм и вариограмм.

Гистограммы и вариограммы значений в кубе и в исходных скважинных данных показаны на


рис. 42. Мы видим, что гистограмма исходных значений воспроизводится в кубе
удовлетворительно. Вертикальная вариограмма данных воспроизводятся в кубе тоже
удовлетворительно – это есть следствие квазитрехмерной интерполяции. Но горизонтальная
вариограмма данных воспроизводится в кубе очень плохо. Радиус горизонтальной вариограммы в
кубе 1600 м против 750 м у вариограммы скважинных данных. Из сравнения горизонтальных
вариограмм можно сделать вывод о том, что весовая интерполяция неправильно воспроизводит
(сильно сглаживает) горизонтальную изменчивость среды.

Рис. 42. Последовательно – гистограммы, горизонтальные вариограммы, вертикальные


вариограммы. Красные линии – для исходных скважинных данных, серые линии –
для значений в кубе после весовой интерполяции.

73
На что еще следует обратить внимание? Гистограмма скважинных значений APS явно
негауссовская. Это говорит о том, что наша среда не является статистически однородной. Мы
можем предположить, что она состоит из нескольких категорий пород, однако трудно сказать, из
какого числа категорий – двух, трех или большего. Еще одна особенность – пороги
горизонтальной и вертикальной вариограмм (прежде всего для скважин, но и в кубе тоже) сильно
различаются. Это показывает, что дисперсия значений в слоях сетки меньше дисперсии значений
вдоль вертикалей. Горизонтальные пласты более однородны по свойствам, чем вертикали.

5.4. Кригинг и стохастические реализации в пространстве 3D

Выше мы много говорили о том, когда можно применять геостатистику. Напомним, что условие,
по сути, только одно – среда должна быть статистически однородной. Первый критерий
статистической однородности – гистограмма свойств должна быть гауссовской. Второй
критерий – вариограмма должна выходить на плато. Но что делать, если среда не является
статистически однородной? Об этом мы тоже говорили. Если в среде есть области, различающиеся
по статистическим свойствам (а горизонты AV1, AV2,..., AV5 явно различаются, см. рис. 41), то
каждую такую область следует рассматривать отдельно. Если в среде присутствуют
детерминированные особенности (а погребенное русло в пласте AV3 есть именно такая
особенность), то они должны быть выделены и исключены. Если среда состоит из разных
категорий пород (а у нас, судя по гистограмме, именно такой случай), то ее необходимо разделить
на категории. Все названные требования просты и понятны. Проблема только в том, что
выполнить их очень трудно.

Вместе с тем мы говорили, что, имея вариограмму, мы всегда можем формально рассчитать
кригинг и стохастические реализации. Может быть, все не так страшно? К нашим
экспериментальным вариограммам (горизонтальной и вертикальной) можно подобрать
следующую комбинированную модель:
⎛ hhorz
2 2
hvert ⎞ ⎛ 2
hhorz 2
hvert ⎞

γ (hvert , hhorz ) = 0.046 Exp⎜ + ⎟ + 0 .054 Exp ⎜ + ⎟
2 2 ⎟ ⎜ 100000 2 20 2 ⎟
⎝ 750 20 ⎠ ⎝ ⎠
где
Exp( x) = 1 − exp( x)
есть обозначение экспоненциальной модели вариограммы.

Рассчитаем кригинг скважинных данных, используя подобранную модель. Результат представлен


на рис. 43. Гистограмма и вариограммы интерполированных значений показаны на рис. 44.

74
Рис. 43. Интерполяция кригингом скважинных значений APS.

Рис. 44. Последовательно – гистограммы, горизонтальные вариограммы, вертикальные


вариограммы. Красные линии – для исходных скважинных данных, синие линии –
для значений в кубе после кригинга.

75
Какие особенности имеет рассчитанная интерполяция кригингом? На горизонтальном сечении мы
видим, что при отходе от точек данных на расстояние порядка радиуса вариограммы (у нас это 750
м), кригинг тянется к среднему. Именно об этом мы говорили в разделе 3.9. Увеличение доли
средних значений (в сравнении с исходными данными и в сравнении с весовой интерполяцией) мы
видим и на гистограмме. Увеличение числа средних значений понижает дисперсию значений, что
отражается на порогах вариограмм. Главное же состоит в том, что горизонтальную изменчивость
среды кригинг воспроизводит неправильно. Кригинг сглаживает горизонтальную изменчивость
примерно так же, как и весовая интерполяция.

Теперь посмотрим на стохастическую реализацию (рис. 45), рассчитанную по той же вариограмме.


Гистограмма и две вариограммы реализации показаны на рис. 46. Можно видеть, что
стохастическая реализация хорошо воспроизводит экспериментальные вариограммы. Это очень
важно – мы гораздо лучше, чем на рис. 41 и 43, воспроизводим горизонтальную изменчивость
геологической среды. Но что касается гистограммы, то ее мы испортили окончательно. Никаких
следов исходных «горбов» в интерполированном кубе не осталось. Распределение значений APS в
нашей реализации превратилось почти в нормальное.

Почему это произошло? Геостатистика исходит из того, что моделируемая среда является
статистически однородной, и что распределение значений в ней – нормальное. Его мы и получили.
То, что гистограмма исходных точечных значений является двугорбой, для геостатистики
значения не имеет. Из объема с нормальным распределением свойств можно выбрать точечные
данные с каким угодно распределением.

Мы же, наоборот, считаем, что гистограмма исходных данных имеет значение, и что интерполяция
в объеме среды должна ее воспроизводить. Поэтому результат с гауссовской гистограммой по
объему нас не устраивает.

76
Рис. 45. Стохастическая интерполяция скважинных значений APS.

Рис. 46. Последовательно – гистограммы, горизонтальные вариограммы, вертикальные


вариограммы. Красные линии – для исходных скважинных данных, зеленые линии –
для куба стохастической реализации.

77
В чем мы убедились в результате последнего расчета? Мы убедились в том, что в достаточно
типичной ситуации (при интерполяции скважинных данных) мы не смогли получить приемлемый
результат. Основной причиной нашей неудачи является, по-видимому, категориальный характер
геологической среды. Что делать, отказаться от геостатистики? Ни в коем случае, поскольку идея
расчета стохастических реализаций чрезвычайно ценна! Геостатистику надо «спасать», она стоит
того.

Для «спасения» геостатистики в ситуациях, подобных вышеописанной, предложено два подхода.


Первый подход – разделение среды на категории посредством индикаторного стохастического
моделирования. Второй подход – формальное превращение исходной гистограммы в гауссовскую
посредством преобразования «Normal Score». Мы рассмотрим сначала первый подход, а затем
второй.

5.5. Последовательное индикаторное стохастическое моделирование (ПИСМ)

Индикаторное стохастическое моделирование решает задачу разделения объема среды на


категории пород. При этом каждому из многих миллионов элементарных объемов присваивается
целый индекс той или иной категории, например «1» – глины, «2» – песчаники, «3» – известняки и
т.д. Мы рассчитываем, что после разделения среды на категории гистограммы скважинных
значений целевого параметра (APS, пористости и т.п.) в пределах каждой из категорий будут
похожи на гауссовскую. Реализации целевого параметра в пределах выделенных категорий
воспроизведут эти гистограммы, что позволит нам принять полученное решение.

Исходное состояние у нас следующее. Мы имеем пространственную стратиграфическую сетку и


значения индексов категорий в ячейках, которые лежат на траекториях скважин. На основании
этих данных нам необходимо рассчитать значения индексов категорий во всех ячейках нашей
сети.

Отметим, что число используемых категорий не должно быть большим. В противном случае
уменьшается приходящийся на одну категорию объем исходных данных, от чего страдает качество
вариограмм. Кроме того, чем больше категорий, тем больше у нас будет искусственных
контрастов в значениях целевого параметра, так как последние рассчитываются в пределах
категорий независимо и не коррелируют. Очень часто среду разделяют только на две категории
пород – «коллектор» и «неколлектор», после чего реализации пористости (если решается задача
интерполяции пористости) рассчитывают только в коллекторе.

Алгоритм ПИСМ позволяет разделять объем среды только на две категории. Поэтому, если число
категорий больше двух, некоторые из них временно объединяют друг с другом таким образом,
чтобы свести задачу к разделению среды именно на две категории. На следующем этапе
выделенную в пространстве одну объединенную категорию разделяют на две подкатегории, и так
далее. С учетом сказанного дополним характеристику исходного состояния: значения индексов в
ячейках на траекториях скважин имеют значения или 0, или 1.

Описание метода ПИСМ мы дадим на примере двумерной сетки. В трехмерном случае все
делается точно так же. Исходное состояние показано на рис. 47: имеется сетка, в некоторых
ячейках которой стоят известные (скважинные) значения индексов – 0 или 1.

78
Рис. 47. Последовательный обход узлов сетки по случайной траектории.

Первое, что мы делаем при индикаторном моделировании – мы рассчитываем вариограмму


индикатора. Однако надо иметь в виду, что никакого «вариограммного облака» (как это было на
рис. 13) мы не получим. Усредняемые точки будут лежать на двух уровнях – на уровне 0 и на
уровне 0.5 (рис. 48). Кривая (экспериментальная вариограмма), рассчитанная в результате
осреднения точек на двух уровнях, весьма условна.

Рис. 48. Экспериментальная индикаторная вариограмма.

Индикаторные вариограммы всегда крутые и аппроксимируются или сферической, или


экспоненциальной моделью. Понятно, что плавно изменяться значения индикатора не могут.
Легко показать, что порог индикаторной вариограммы равен произведению P0 (доли в
пространстве категории 0) на P1 (доли категории 1).

Алгоритм ПИСМ в основных чертах повторяет алгоритм ПГСМ (рис. 49). Мы последовательно
обходим точки на сетке (те, в которых у нас нет значений) по случайной траектории. В каждой
очередной точке мы рассчитываем значение кригинга, используя для этого известные данные

79
(рис. 49 а). Полученное значение кригинга (в нашем примере это 0.65) мы интерпретируем как
вероятность иметь в рассматриваемой точке категорию «1». Далее мы реализуем эту вероятность.
Для этого мы генерируем случайное число из равномерного распределения на интервале [0,1].
Если это случайное число оказывается меньше значения кригинга, в рассматриваемую точку
заносится значение 1; в противном случае в рассматриваемую точку заносится значение 0.
Определенное таким образом значение присоединяется к числу известных данных, то есть
получает статус «значение в скважине». После этого на сетке выбирается следующая случайная
точка, которая не должна совпадать ни с одной из уже определенных. Для новой точки все
повторяется, но с одним изменением – в расчете кригинга участвует уже на одну точку больше,
чем на предыдущем шаге. После того, как мы заполняем значениями все ячейки сетки, расчет
реализации индикатора считается завершенным.

Рис. 49. Расчет реализации методом ПИСМ: а – значение кригинга в очередной точке
прогноза; б – случайное число, равномерно распределенное на интервале [0, 1],
сравнивается со значением кригинга; в – если случайное число меньше значения
кригинга, в точку заносится 1, в противном случае заносится 0.

Расчет следующей реализации начинается с того, что мы оставляет на плане только истинные
исходные значения... (дальнейшее повторяет сказанное в отношении ПГСМ). Отметим только
самое важное. Если наряду со скважинными данными у нас есть карта или куб вспомогательной
переменной, то мы можем каждое значение на этой карте интерпретировать в терминах
вероятности категории «1». После этого значение вероятности, рассчитанное на очередном шаге
кригингом, мы можем по формуле Байеса сложить с вероятностью, определяемой картой, и
получить суммарную вероятность в точке категории «1». И именно эту суммарную вероятность
мы можем дальше реализовывать (выбрасывать случайное число и т.д.). В результате карта (куб)
пространственного распределения категорий будет коррелировать с картой (кубом)
вспомогательной переменной.

80
Покажем теперь, что можно получить при помощи индикаторного стохастического моделирования
в нашем примере 3D.

5.6. Расчет реализаций параметра с разделением на категории

Прежде всего, мы должны разделить на категории пород элементарные объемы на скважинах.


Посмотрим еще раз на распределение значений APS в объемах на траекториях скважин (рис. 50).
Мы должны, посредством пороговых значений, разделить это распределение на фрагменты таким
образом, чтобы каждый фрагмент стал похож на распределение Гаусса. Пороговые значения APS
определят нужные нам категории.

Рис. 50. Разделение на категории распределения значений APS на скважинах.

Очень часто для разделения среды на коллектор и неколлектор используют значение APS равное
0.35 (синяя линия на рис. 50). Но сейчас такое разделение нас никак не устроит. Причина в том,
что распределение APS в интервале «больше, чем 0.35» совершенно не похоже на гауссовское, и
мы не сможем его воспроизвести при расчете реализаций. Прямо скажем, подходящий нам
вариант разделения на категории на гистограмме на рис. 50 не просматривается.

Сделаем следующее замечание. Искусство применения геостатистики заключается не в том, чтобы


в той или иной программной системе нажимать на кнопку «Рассчитать 100 реализаций».
Искусство применения геостатистики (здесь мы выражаем частное мнение) заключается в умении
находить и устранять причины деформации нормального распределения. Каждая негауссовская
гистограмма говорит о чем-то важном и интересном, надо только понять, что именно она говорит.
Даже наш самый первый пример с яблоками (п. 2.3) показывает, что, восстанавливая гауссовское
распределение, мы не отходим от сути проблемы, а приближаемся к ней.

Что надо сделать в ситуации, показанной на рис. 50? Надо рассмотреть горизонты AV1 – AV5 по
отдельности. У каждого горизонта будет своя гистограмма и свои причины ее деформации. Что-то

81
прояснится. Надо также посоветоваться с геологом. Он подскажет, какие должны быть категории
пород. Вот тогда все получится.

Мы же, для иллюстрации метода ПИСМ, сделаем следующее. Мы выделим интервал APS
«больше, чем 0.8», соответствующий коллекторам самого высокого качества (правее зеленой
линии на рис. 50). На указанном участке гистограмма исходных значений близка к гауссовской.

Результат выделения в пространстве категории «высококачественный коллектор» показан на


рис. 51. Это одна из реализаций, рассчитанных методом ПИСМ. Гистограмма и две вариограммы
индикатора в исследуемом объеме (в сравнении с аналогичными характеристиками скважинных
данных) показаны на рис. 52.

Рис. 51. Рассчитанная методом ПИСМ реализация категории «высококачественный


коллектор». На вертикальном сечении показаны скважины, отстоящие от плоскости
сечения не более чем на 100 м.

82
Рис. 52. Последовательно – гистограммы, горизонтальные вариограммы, вертикальные
вариограммы. Красные линии – для исходных скважинных данных, зеленые линии –
для куба стохастической реализации. Пунктиры на правом графике показывают
пороги вариограмм, соответствующие долям категорий на скважинах и в объеме
среды.

Что можно сказать о результатах расчета? Пропорции категорий в скважинных данных и в объеме
среды практически совпадают. Радиусы вертикальных вариограмм совпадают. Радиусы
горизонтальных вариограмм также примерно совпадают. Пропорции категорий на вертикалях
близки к пропорциям в объеме среды, что видно по порогам вертикальных вариограмм.
Пропорции категорий в слоях сетки отличаются от пропорций во всем объеме, причем для
скважин сильнее, чем для куба. В целом результат разделения объема среды на две заданные
категории выглядит вполне удовлетворительным.

После выделения в пространстве целевой категории мы переходим к интерполяции относящихся к


ней скважинных данных APS. Но обратите внимание – мы получили в пространстве множество
изолированных фрагментов (линз), относительно которых мы не имеем никаких скважинных
данных. Как мы будем определять свойства в пределах этих фрагментов? Ответ простой – мы
будем считать, что значения свойств в изолированных фрагментах коррелируют согласно нашим
вариограммам. То есть, мы будем интерполировать скважинные данные (в отношении целевой
категории) в сплошной среде, но результат возьмем только в пределах нужной нам категории.
Предположение о коррелированности свойств изолированных фрагментов есть некоторая
«натяжка», но на нее закрывают глаза.

На рис. 53 показана реализация параметра APS в пределах категории «высококачественный


коллектор». На рис. 54 показаны соответствующие гистограммы и вариограммы. При
моделировании радиус горизонтальной вариограммы значений APS задавался равным 750 м, то
есть как рассчитанный по всем (то есть не фильтрованным) скважинным значениям APS. С этой
небольшой оговоркой можно заключить, что гистограмма и вариограммы интерполированных
значений соответствуют аналогичным характеристикам исходных данных. Мы получили то, что
хотели. Результат интерполяции значений APS в пределах категории «высококачественный
коллектор» нас вполне устраивает.

83
Рис. 53. Стохастическая интерполяция скважинных значений APS в пределах категории
«высококачественный коллектор».

Рис. 54. Последовательно – гистограммы, горизонтальные вариограммы, вертикальные


вариограммы. Красные линии – для исходных скважинных данных, синие линии –
для реализации APS. Все – в пределах категории «высококачественный коллектор».

84
Таким же образом мы должны проинтерполировать скважинные данные в пределах всех других
категорий. Но, напомним, без серьезного анализа (выходящего за рамки данного курса) никакие
другие категории в нашем примере мы выделить не смогли. Поэтому мы вынуждены завершить
описание интерполяции с использованием разделения на категории и перейти к обсуждению
второго «спасательного круга» геостатистики – преобразования «Normal Score (NS)». Метод NS
позволит нам получить желаемый результат.

5.7. Расчет реализаций параметра с использованием преобразования «Normal Score»

Вернемся в исходную точку. Наша проблема состоит в том, что распределение известных
значений параметра (на скважинах) является негауссовским. В этой ситуации формальный расчет
стохастических реализаций коренным образом меняет исходную гистограмму, что нас никак не
устраивает. Разделение среды на категории в принципе позволяет решить проблему должным
образом, но этот путь, во-первых, требует глубокого анализа исходных данных и, во-вторых,
является очень сложным технически. Даже в демонстрационном примере мы не смогли пройти его
до конца.

Но есть еще и второй путь решения той же проблемы, гораздо более легкий. Он состоит в том, что
мы просто меняем шкалу, при помощи которой измеряется наш параметр (APS, пористость и т.п.).
Новая шкала выбирается таким образом, чтобы значения параметра на скважинах, измеренные в
новых единицах, оказались распределенными по Гауссу. Отсюда и название – метод нормального
преобразования («Normal Score»). Дальше мы действуем на совершенно законных основаниях – по
известным значениям параметра (в новых единицах) рассчитываем вариограмму и выполняем
стохастическую интерполяцию. Последняя, как мы знаем, сохраняет гауссовское распределение (в
новых единицах). На заключительном этапе выполняется обратное преобразование NS, и мы
получаем значения в объеме, гистограмма которых точно совпадает с гистограммой исходных
данных.

Описанный процесс (и его издержки) легче всего пояснить при помощи рис. 55. Для простоты
показан пример 1D – интерполяция точечных значений (пористости) вдоль координатной оси Х.
Рис. 55 разделен на четыре фрагмента – «а», «б», «в» и «г». Прокомментируем их
последовательно.

Фрагмент «а». В правой части показаны неизвестные нам истинные значения пористости
(непрерывная линия) вдоль координаты X. У нас есть только значения пористости в отдельных
точках (данные по скважинам). На вертикальной оси показана исходная равномерная шкала
пористости P (с одинаковыми интервалами). Рядом со шкалой пористости помещена гистограмма
известных значений пористости – она показывает частоту, с которой точки попадают в интервалы
на шкале P. Гистограмма имеет двугорбый вид – у нас много высоких значений пористости
(песчаные тела), много низких значений (глинистые тела), и почти нет промежуточных значений.

В левой части фрагмента «а» помещена измененная, неравномерная шкала пористости P*(с
интервалами разной ширины). Интервалы на шкале изменены так, чтобы в центральный интервал
попадало больше всего точек, а дальше, по мере удаления от центра, число точек, попадающих в
интервалы, постепенно уменьшалось (точно так, как в распределении Гаусса).

Фрагмент «б». Значения пористости вдоль координаты X показаны теперь в единицах P*. В новых
единицах часть точек, попадавших в прежние максимумы, смещается ближе к среднему значению.

85
При этом разница между песчаниками и глинами в единицах P* уменьшается, а малые флуктуации
пористости в пределах песчаников и глин, наоборот, увеличиваются. Но зато теперь известные
значения (в единицах P*) распределены по Гауссу. Для известных точечных значений (в единицах
P*) рассчитывается вариограмма.

Фрагмент «в». На основании полученной вариограммы выполняется стохастическая интерполяция


известных точечных значений. Результат получается в единицах P*. Гистограмма и вариограмма
интерполированных значений в точности соответствует гистограмме и вариограмме данных в
единицах P*.

Фрагмент «г». Производится обратное преобразование интерполированных значений к исходным


единицам P. После этого гистограмма интерполированных значений точно совпадает с исходной
двугорбой гистограммой данных. Но вариограмма интерполированных значений не воспроизводит
исходную вариограмму данных, поскольку песчаные тела получают размер, близкий к размеру
малых флуктуаций пористости в песчаниках и глинах.

86
Рис. 55. Стохастическая интерполяция с использованием преобразования «Normal Score»
(пояснения даны в тексте).

Описание метода «Normal Score» получилось у нас с большой долей критики. В отношении
вариограммы наша критика чрезмерна. Чтобы улучшить решение, делают небольшую подмену –
преобразованные данные интерполируют на основании не их собственной вариограммы
(рассчитанной после преобразования), а на основании исходной. У которой меняют только порог.
После этого песчаные тела приобретают должный размер.

Рассмотрим теперь, какой результат дает стохастическая интерполяция методом «Normal Score» в
нашем примере. Кубы интерполированных скважинных значений APS (две реализации) показаны
на рис. 56. Гистограмма и вариограммы интерполированных значений представлены на рис. 57.

87
Рис. 56. Две реализации стохастической интерполяции скважинных значений APS с
использованием преобразования «Normal Score».

88
Рис. 57. Последовательно – гистограммы, горизонтальные вариограммы, вертикальные
вариограммы. Красные линии – для исходных скважинных данных, синие линии –
для реализации APS, рассчитанной с использованием преобразования «Normal
Score».

Мы видим, что выполненная интерполяция идеально воспроизводит гистограмму скважинных


данных и их вертикальную вариограмму. Горизонтальная вариограмма воспроизводится пусть не
идеально, но достаточно хорошо. Поставленная задача решена успешно?

Нет, не совсем. Интерполяцию, основанную на преобразовании «Normal Score», следует


использовать с большой осторожностью. Почему? Причина состоит в следующем. Мы уже
говорили, что отклонение гистограммы данных от гауссовского распределения указывает на то,
что в поведении параметра присутствуют детерминированные (не случайные) черты. Их
необходимо выделить и исключить. Вместо этого преобразование «Normal Score» предлагает нам
формально воспроизводить искаженное (негауссовское) распределение. Причем воспроизводить
повсеместно.

Чтобы убедиться в слабости решения, основанного на преобразовании «Normal Score», достаточно


проверить его локально. Результат такой проверки для пласта AV1 показан на рис. 58.
Интерполяция, основанная на преобразовании «Normal Score», порождает в пласте AV1
множество значений APS близких к единице, которых нет в исходных данных. Несколько в
меньшей степени, но то же самое имеет место для значений APS близких к нулю. Все это
отчетливо видно на горизонтальном сечении пласта AV1 (рис. 59). Обратите внимание – значения,
близкие к единице (красный цвет), и значения, близкие к нулю (зеленый цвет), располагаются
строго между скважинами. В самих скважинах (на уровне сечения) близких к единице и близких к
нулю значений нет.

Ну и что, к какому выводу мы пришли? Модели, которые дает геостатистика, плохие? Нет, не
плохие. Реализации, показанные на рис. 56, очень неплохие. Даже, можно сказать, замечательные!
Они несравненно лучше нашего исходного детерминированного решения, показанного ранее на
рис. 41. Вот только горизонт AV1 следовало рассчитать отдельно.

На этом подробное рассмотрение геостатистических реализаций в пространстве 3D мы завершаем.


Нам осталось рассмотреть несколько обязательных тем, среди которых есть и очень важные. Но
мы их рассмотрим достаточно кратко, стараясь, по возможности, обращать внимание только на
самое интересное. Пытаться объять необъятное мы не будем.

89
Рис. 58. Гистограммы и горизонтальные вариограммы. Красные линии – для исходных
скважинных данных, синие линии – для реализации APS, рассчитанной с
использованием преобразования «Normal Score». Проверка для пласта AV1.

Рис. 59. Куб APS, рассчитанный с помощью преобразования «Normal Score».


Горизонтальное сечение в интервале пласта AV1. Все красные и зеленые области
находятся исключительно между скважинами.

90
6. Неклассические геостатистические методы
В предыдущей главе мы выпустили в сторону геостатистики много критических стрел. Давайте
восстановим баланс и скажем в ее адрес необходимые положительные слова. Например, скажем о
том, какие идеи геостатистики мы считаем очень ценными.

1. Очень ценной мы считаем идею анализа гистограмм данных. Повторим – каждая негауссовская
гистограмма говорит о чем-то важном и интересном, надо только понять, что именно она говорит.
Чрезвычайно полезным (для выяснения причин искажения нормального распределения) является
сравнительный анализ гистограмм данных по разным участкам на плане XY и по разным
интервалам (стратиграфическим горизонтам) по Z.

2. Столь же ценной и конструктивной является идея расчета вариограммы. Имея на площади всего
несколько пар близко расположенных скважин, мы можем (сравнивая значения скважинных
параметров на разных уровнях Z) достаточно хорошо рассчитать наиболее важный начальный
участок вариограммы и получить представление о характере горизонтальной изменчивости среды.

3. Идея расчета стохастических реализаций является просто блестящей! Недостаток данных мы


восполняем тем, что рассчитываем множество равновероятных прогнозов. При
детерминированном моделировании мы указываем доверительные интервалы. Реализации дают
нам гораздо больше – они показывают, какими именно могут быть решения внутри доверительных
интервалов.

4. Сравнение гистограмм и вариограмм исходных данных и интерполированных значений


позволяет нам эффективно контролировать качество интерполяции.

Важным достоинством классической двухточечной геостатистики (основанной на использовании


вариограмм) является ее математическая строгость. Дальше в этой главе мы рассмотрим несколько
неклассических геостатистических методов, включающих большую или меньшую долю
эвристики. Все они заимствовали из классической геостатистики ее главную идею – идею расчета
стохастических реализаций.

6.1. Объектное моделирование

В разделе Введение мы говорили о том, что модель среды должна соответствовать не только
скважинным и сейсмическим данным, но и нашим знаниям о процессах формирования
геологической среды. Объектное моделирование является инструментом, позволяющим
представлять знания о среде (в отношении вероятной формы песчаных и иных тел) в виде моделей
среды.

Объектное моделирование решает относительно простую задачу – задачу категориальной


интерполяции данных. При этом число используемых категорий обычно невелико. Типичной
задачей объектного моделирования является расчет в пространстве возможной конфигурации
песчаных тел – русел или каналов. Используя диалоговый интерфейс, геолог указывает основное
направление русел, их ширину и толщину, период и амплитуду их синусоидальных искривлений.
Все параметры характеризуются средними значениями и среднеквадратичными отклонениями.
Вместо русел (или в дополнение к ним) могут быть описаны тела линзовидной или
конусообразной формы. Программа последовательно генерирует и помещает в пространство

91
множество (тысячи, миллионы) соответствующих объектов, но оставляет только те из них,
которые согласуются со скважинными данными.

Дополнительно можно потребовать, чтобы результат моделирования соответствовал заданной


гистограмме, геолого-статистическому разрезу и (или) карте эффективной мощности. Бывает так,
что программа не может выполнить все заданные условия – тогда геологу приходится их
ослаблять. После расчета одной реализации распределения в пространстве песчаных тел
рассчитывается вторая, и так далее. Оценка реализаций при помощи вариограмм возможна, но
обязательной не является. Особенностью объектного моделирования является то, что оно лучше
работает при малом количестве скважин.

Пример объектного моделирования показан на рис. 60 вверху. Ниже показан результат,


полученный по тем же скважинным данным при помощи индикаторного моделирования.
Наблюдательный читатель может заметить, что при индикаторном моделировании число
категорий было уменьшено с трех до двух. Какой результат ближе к истине? И первый, и второй
метод не более чем инструменты в руках геолога.

6.2. Многоточечная геостатистика

Посмотрим еще раз на рис. 60 (на фрагмент внизу). Он показывает, что индикаторное
моделирование на основе двухточечной вариограммы позволяет нам очень слабо влиять на
конфигурацию песчаных тел. Мы можем лишь приблизительно задавать средние размеры этих тел
и, дополнительно, придавать этим размерам некоторую анизотропию. Объектное моделирование
(рис. 60 вверху) позволяет нам больше – мы можем задавать конфигурацию отдельных песчаных
тел непосредственно. Но при этом мы не очень хорошо контролируем, какую конфигурацию
принимает совокупность этих тел. Однако бывает так, что большое значение имеет конфигурация
именно их совокупности. Например, геологу необходимо воспроизвести в модели
пространственную картину, аналогичную той, которую он видит на космическом снимке какой-
нибудь дельты. Имея такой снимок (или иной подобный образ), геолог хочет получить результат,
близкий к нему настолько, насколько позволяют скважинные данные. Названная задача решается
при помощи многоточечной геостатистики.

Метод, имеющий столь внушительное название, на самом деле очень прост. Для его объяснения
достаточно одной иллюстрации (рис. 61). На представленном рисунке показан расчет на
двумерной сетке, но в трехмерном случае все делается точно также (за исключением того, что
сложнее подготовить эталонный образ). Итак, с левой стороны помещен план XY исследуемой
площади. Окрашены те ячейки сетки, в которые попали скважины. Цветом ячеек отображены
скважинные данные в отношении типа пород (коллектор или неколлектор). С правой стороны
показан подготовленный эталонный образ. В центре на рис. 61 изображен используемый шаблон.
В нашем случае это квадрат размером 7х7 ячеек.

92
Рис. 60. Вверху – одна из реализаций объектного моделирования. Внизу – одна из
реализаций (на основании данных тех же скважин) индикаторного моделирования.

93
Рис. 61. Алгоритм метода «многоточечная геостатистика» (пояснения в тексте).

Порядок работы с планом XY, эталонным образом и шаблоном следующий. Первое – случайным
образом выбирается ячейка на плане XY, отличная от известных. Пусть это будет ячейка (точка)
А. С ней совмещается центральная ячейка шаблона, после чего на шаблон переносятся попавшие в
него скважинные данные (выделены окружностями). Второе – шаблоном с попавшими в него
данными сканируется весь эталонный образ и фиксируются те положения шаблона, при которых
данные на шаблоне совпадают с подложенной картиной. В нашем примере таких положений
оказалось три (показаны на рис. 61). В каждом таком положении проверяется тип породы в
центральной ячейке шаблона. У нас дважды в центре оказывается «коллектор» и один раз
«неколлектор». На этом основании делается вывод о том, что вероятность коллектора в точке А
составляет 66%. Третье и последнее – генерируется случайное число, равномерно распределенное
на интервале [0,1]. Если оно оказывается меньше, чем 0.66, в точку A заносится значение
«коллектор», в противном случае – «неколлектор». После этого ячейка A получает такой же
статус, как ячейки со скважинами, и процесс продолжается дальше. При заполнении всех ячеек
расчет реализации считается завершенным. Затем рассчитывается вторая реализация, и т.д.

Где в этом методе элемент эвристики? В сравнении с объектным моделированием он выглядит


более строгим. Эвристика заключается в том, что мы, помимо скважинных данных, используем в
ходе интерполяции посторонний образ.

У метода многоточечной геостатистики есть свои проблемы. Например, рассчитанная при помощи
описанного алгоритма картина может иметь дефекты в виде разрывов (рис. 62). Метод приходится
усложнять. Для более глубокого знакомства с многоточечной геостатистикой рекомендуем
обратиться к работе Daly, Caers, 2010.

94
Рис. 62. Результат расчета методом многоточечной геостатистики. Отмечены разрывы
русел.

6.3. Нечеткая геологическая модель

6.3.1. Введение

Прежде, чем идти дальше, подведем очередной промежуточный итог (проведем сеанс рефлексии).
Мы рассмотрели шесть методов: детерминированную (весовую) интерполяцию, кригинг и
реализации кригинга, а также три метода категориальной интерполяции данных – индикаторное
моделирование, объектное моделирование и многоточечную геостатистику. Откуда такое
изобилие?
На самом деле все очень логично. Детерминированные методы не воспроизводят истинную
изменчивость геологической среды. Их результат зависит от плотности данных (скважин). Это
плохо, и поэтому они нас не устраивают. Геостатистические реализации воспроизводят
изменчивость среды, но исходят из ее статистической однородности. Все (не выделенные)
детерминированные особенности, которые присутствуют в данных, в реализациях стираются. То
есть никаких особенностей чередования тонких и толстых пластов, узнаваемых конфигураций
литологических тел и т.п. в реализациях не остается. Это тоже плохо. Чтобы вернуть в реализации
детерминированные черты, придумали объектное моделирование и многоточечную геостатистику.
Детерминированные черты в реализациях действительно появляются. Но это не те черты, которые
присутствуют (зачастую в глубоко скрытом виде) в данных, а те, которые «навязывает» геолог.
Теперь понятно, что мы собираемся предложить. Мы собираемся предложить метод, который
будет рассчитывать стохастические реализации, имеющие те самые детерминированные черты,
которые присутствуют в данных. И нам не надо будет предварительно искать, выявлять эти
черты – они сами проявят себя в реализациях.

Метод, который мы имеем в виду, называется «нечеткая геологическая модель». Поясним, что он
дает, при помощи следующего примера. Выведем на один профиль 5 скважин с вертикальными
разрезами пористости. Попросим 10 геологов, чтобы каждый взял пачку фломастеров (20 цветов)

95
и нарисовал по этим скважинам профильный разрез пористости. В результате мы получим 10
разных разрезов. Каждое значение пористости (с шагом в один процент) будет закрашено своим
цветом, но на каждом разрезе это будет сделано чуть иначе, чем на других. И конечно, эти разрезы
нельзя будет назвать статистически однородными. Вот примерно такие реализации пористости
дает нечеткая геологическая модель.

Суть нечеткой модели – категориальная интерполяция количественных данных (APS, пористости


и т. п.). Если в некоторой точке значение APS равно 0.7, то мы считаем, что и в окружающей
области пространства значение APS тоже равно 0.7. Между соседними точками данных (точкой 1
и точкой 2) с разными значениями APS возникает зона неопределенности, поскольку мы не знаем,
где в пространстве кончается значение 1 и начинается значение 2. Названную неопределенность
мы представим с помощью множества реализаций. Но значения в этих реализациях не будут
распределены по Гауссу. Реализации будут отличаться лишь положением границы, разделяющей
значение 1 и значение 2.

6.3.2. Нечеткое представление значения параметра в элементарном объеме среды

Каким образом мы представляем прогнозное значение параметра в каждом элементарном объеме


среды? В детерминированной модели значение количественного параметра представляется одним
числом, допустим, P(x,y,z)=12%. Погрешность этого значения оценивается экспертным путем. О
недостатках экспертной оценки погрешности (не дифференцирована в пространстве, не учитывает
корреляцию значений погрешности в пространстве) мы уже говорили в разделе 2.11.

Геостатистика (кригинг) представляет прогнозное значение параметра в каждой точке двумя


числами, второе из которых явно указывает погрешность. Например, P(x,y,z)=12 ± 1%. В этом
случае погрешность дифференцирована в пространстве. В стохастических реализациях параметра
учитывается пространственная корреляция погрешности. Вследствие названных факторов
геостатистическая интерполяция дает более точный прогноз, чем детерминированная.

Однако бывают ситуации, когда адекватно представить прогнозное значение параметра при
помощи только двух чисел невозможно. Рассмотрим пример, показанный на рис. 63 а. Точка А
расположена вблизи границы между породами с пористостью 4% и 12%. Какой прогноз
пористости мы можем дать в точке А?

Рис. 63. Представление пористости в точке А на основе нечетких множеств Л. Заде.

96
Кригинг дает в точке А что-то похожее на PA = 8±1%. Принять этот прогноз мы не можем,
поскольку скважинные данные однозначно указывают на отсутствие вблизи данной скважины
пород с пористостью 8%. Корректный геостатистический подход требует предварительно
разделить среду на категории пород, после чего выполнять интерполяцию пористости отдельно в
пределах каждой категории. Трудности, которые встречаются на этом пути, мы описали в главе 5.
Напомним – мы так и не смогли довести пример с реальными скважинными данными до конца.
Чтобы получить решение нам пришлось использовать не очень натуральный метод «Normal
Score».

Но вернемся к представлению параметра в точке A. В описанном случае может быть полезным


нечеткое представление, впервые введенное Л. Заде. Согласно этому представлению
прогнозируемая пористость описывается бимодальной функцией принадлежности ζ, с одним
максимумом около 4%, и с другим максимумом около 12% (рис. 63 б). После разделения всего
диапазона возможных значений пористости (0 – 20%) на n категорий, функцию принадлежности
можно аппроксимировать ступенчатой функцией и экономно представить набором из n чисел ζ 1, ζ
2,... ζ n, 0 ≤ ζ i ≤ 1, Σζ i ≤ 1. Каждое число ζ i представляет объем свидетельств в пользу того, что
прогнозируемая величина принадлежит к интервалу (категории) i. Такое представление, когда
значение параметра в элементарном объеме среды определяется набором из n чисел (обычно n не
более 20) будем называть нечеткой моделью (Ковалевский, 2007).

6.3.3. Порождение и суммирование свидетельств

Но откуда мы получим свидетельства ζ 1, ζ 2,... ζ n в пользу различных категорий параметра в


каждом элементарном объеме среды? Для расчета свидетельств можно использовать три
процедуры: (1) нечеткую трансформацию скважинных данных; (2) нечеткую трансформацию
сейсмических атрибутов; (3) суммирование нечетких свидетельств по правилу Демпстера.

Что такое нечеткая трансформация скважинных данных? Каждый элементарный объем на


траектории скважины (и в котором, будем считать, величина параметра является истинной) можно
рассматривать как источник свидетельств в пользу имеющегося в нем значения. Можно полагать,
что этот источник распространяет названные свидетельства на пространственный объем
эллипсоидальной формы (рис. 64). Величина этих свидетельств уменьшается от единицы в центре
эллипсоида (в самом источнике) до нуля на внешней границе эллипсоида. Радиусы эллипсоида
(горизонтальный и вертикальный) определяются так, чтобы в каждую точку пространства
приходили свидетельства из 10-20 ближайших источников. Много большее число свидетельств
приведет (после суммирования по Демпстеру) к чрезмерному доминированию категории,
преобладающей в данных. Оптимальным является горизонтальный радиус, равный среднему
расстоянию между скважинами, и вертикальный радиус, равный 2-3 ячейкам объема. Радиусы
вариограмм (вертикальной и горизонтальной) являются предельными расстояниями для
экстраполяции свидетельств.

97
Рис. 64. Каждая точка на траектории скважины является источником свидетельства в
пользу своего значения.

Вторая процедура порождения свидетельств состоит в нечеткой трансформации сейсмических


атрибутов. В отличие от точек на траекториях скважин, производящих свидетельства в пользу
единственной категории (присутствующей в точке), одно значение сейсмического атрибута
порождает свидетельства ζ1, ζ2, ... ζn в пользу сразу нескольких категорий. Это следует из
неоднозначной интерпретации каждого сейсмического атрибута. Примеров включения в нечеткую
модель сейсмических атрибутов пока нет.

Все независимые свидетельства, относящиеся к одному и тому же элементарному объему,


суммируются. Процедура суммирования должна удовлетворять следующим трем условиям.
Первое – суммирование не должно нарушать нормировку свидетельств. То есть, после
суммирования сумма итоговых компонент ζi не должна превышать 1. Второе – если какое-либо из
свидетельств имеет одну компоненту, равную 1 (и все остальные равные 0, как это имеет место на
траектории скважины), то оно не должно измениться после суммирования. Именно это условие не
позволяет использовать арифметическое суммирование свидетельств. И третье – процедура
суммирования свидетельств должна быть коммутативной, то есть ее результат не должен зависеть
от порядка суммирования.

Всем трем условиям удовлетворяет суммирование свидетельств по правилу Демпстера (Gordon,


Shortliffe, 1985). Проще всего объяснить это правило на примере. Пусть множество значений
категориального параметра состоит из четырех категорий – a, b, c и d. Объединенное множество
{a, b, c, d} обозначим Θ, пустое множество обозначим ø. Предположим, мы имеем два набора
свидетельств E1 и E2:

E1: a(0.32), b(0.18), c(0.28), d(0.10), Θ(0.12);


E2: a(0.55), b (0.10), Θ (0.35).

98
В скобках показаны свидетельства в пользу предшествующих категорий. Обратите внимание, если
сумма свидетельств в пользу отдельных категорий меньше 1, остаток приписывается Θ. Для
суммирования E1 и E2 мы должны составить следующую таблицу:

Табл. 1. Суммирование свидетельств E1 и E2 по правилу Демпстера.

Верхняя строка и левая колонка таблицы показывают исходные свидетельства E1 и E2. Значения в
других клетках таблицы являются произведением компонент Е1 (из той же колонки) и Е2 (из той
же строки). Полученные значения присваиваются категориям, которые являются пересечением
категорий Е1 (из той же колонки) и Е2 (из той же строки). Пересечением одинаковых категорий и
пересечением категории и Θ является та же самая категория, пересечением разных категорий
является ø, пересечением двух Θ является Θ.

Величины, рассчитанные в ячейках таблицы, являются результатом суммирования. Их сумма


равна 1, так что условие нормализации выполняется. Однако некоторые из рассчитанных значений
присвоены ø. Мы исключаем значения, присвоенные ø, и компенсируем их потерю
перенормировкой оставшихся. Объединяя разные порции свидетельств в пользу одних и тех же
категорий, получим окончательный результат суммирования E3 = E1 + E2:

E3: a(0.569), b(0.149), c(0.158), d(0.056), Θ(0.068).

6.3.4. Расчет реализаций нечеткой модели

После суммирования свидетельств, исходящих из точек на траекториях скважин, мы получим


искомые нечеткие представления параметра (как на рис. 63 б) в каждом элементарном объеме
среды. Далее в каждом таком объеме мы сможем выявить то значение параметра, в пользу
которого объем суммарного свидетельства является максимальным. Мы также сможем
визуализировать эти значения параметра. При необходимости, мы сможем дополнительно
рассчитать и визуализировать определенность прогноза в каждой точке среды, используя для
этого, например, отношение величины максимального свидетельства к сумме всех свидетельств в
той самой точке. Эти величины (параметр и его определенность) и будут результатом
интерполяции скважинных данных?

Нет, не будут. Описанный прогноз не устраивает нас вот по какой причине. В нем остаются
скрытыми значения параметра, в пользу которых также имеются свидетельства, уступающие
максимальному, возможно, очень малую величину. Представьте – в большом объеме среды
свидетельства в пользу пористости 1-2% лишь чуть-чуть превосходят свидетельства в пользу
пористости 19-20%. И что же, весь этот объем мы должны записать в неколлектор? Это было бы
неправильно.

Чтобы проявить скрытые (меньшие) свидетельства необходимо осуществить расчет реализаций


нечеткой модели, подобно тому, как мы рассчитываем реализации методом ПГСМ. То есть, мы

99
должны обойти все элементарные объемы модели по случайному пути, исключая те, в которых
значение параметра определено однозначно. В каждом очередном объеме генерируется случайное
число, равномерно распределенное на интервале [0, 1]. Одновременно мы делим интервал [0, 1] на
внутренние участки, пропорциональные имеющимся в этом объеме свидетельствам в пользу
различных категорий. Решение о значении параметра принимается в зависимости от того, на какой
участок попадает случайное число. После этого рассмотренный объем сам становится источником
свидетельств в пользу той категории, которая ему определена. Заполнив весь куб, мы получим
одну из множества возможных реализаций значений параметра в объеме среды. После этого мы
выполняем расчет следующей реализации, начиная с выбора нового случайного пути обхода
элементарных объемов, и так далее.

Важное отличие от последовательного гауссовского стохастического моделирования состоит в


следующем. Если при расчете кригинга мы учтем одну точку данных 1000 раз, результат не
изменится. При суммировании по Демпстеру в такой же ситуации результат изменится. Поэтому
количество влияющих на очередной объем окружающих источников свидетельств должно
оставаться неизменным (только 10-20 ближайших). Это означает, что радиус влияния источников
по мере увеличения их числа (то есть по мере заполнения пространства определенными точками)
должен сокращаться. Если этого не сделать, мы получим в 99% элементарных объемов одно и то
же значение APS – то, которое преобладает в исходных данных.

Следующее замечание касается площадей с неравномерной или очень малой плотностью скважин.
Максимальный горизонтальный радиус эллипсоида свидетельств не должен превышать радиус
горизонтальной вариограммы, рассчитанной по скважинным данным. В противном случае на
участках с малой плотностью скважин мы получим бессмысленные однородные области. Наличие
предельного радиуса приводит к тому, что на большом удалении от скважин максимальным
оказывается свидетельство в пользу диагноза Θ. Как мы должны поступать, когда при расчете
реализаций случайное число выпадает в пользу Θ? Здесь возможны два варианта. Первый –
решение можно просто откладывать (и точку не заполнять). В результате области, наиболее
удаленные от скважин, будут получать значения в последнюю очередь, то есть их заполнение
будет идти по мере расширения заполненных областей от скважин. Второй вариант –
свидетельства в пользу Θ можно перераспределять в соответствии с гистограммой скважинных
данных (или с гистограммой скважинных данных по пласту).

Множество рассчитанных реализаций нечеткой модели адекватно представляет неопределенность


значений параметра в объеме среды.

100
6.3.5. Расчет реализаций нечеткой модели для примера со скважинными данными APS

Вернемся к нашему реальному примеру. По имеющимся скважинным данным были рассчитаны


две реализации нечеткой модели в отношении параметра APS (рис. 65).

Рис. 65. Вертикальное и горизонтальное сечение двух реализаций куба APS, рассчитанных
как реализации нечеткой модели.

101
Сравнение гистограммы и вариограммы для скважинных данных и для реализации нечеткой
модели показано на рис. 66. Максимальный горизонтальный радиус распространения свидетельств
составлял (в соответствии с горизонтальной вариограммой скважинных данных) 750 м.
Свидетельства в пользу Θ не перераспределялись, что касалось в основном только левого верхнего
угла площади, где плотность скважин несколько ниже. Можно видеть, что и горизонтальная
изменчивость, и гистограмма значений по скважинным данным воспроизведены в реализации
нечеткой модели достаточно хорошо. Вспомним, что точно такой же результат в отношении
гистограммы и вариограммы мы получили для реализации, рассчитанной методом «Normal Score»
(рис. 57).

Рис. 66. Гистограммы и горизонтальные вариограммы. Красные линии – для исходных


скважинных данных, зеленые линии – для реализации APS нечеткой модели.

102
6.3.6. Сравнение реализации нечеткой модели и реализации «Normal Score»

Сравним реализацию нечеткой модели с реализацией метода «Normal Score». Для наглядности
поместим сечения одной и другой реализации рядом (рис. 67).

Рис. 67. Вертикальное и горизонтальное сечение реализации «Normal Score» (вверху слева и
внизу) и нечеткой модели.

103
На что здесь надо обратить внимание? Первое – в реализациях метода «Normal Score» мы видим
плавные переходы от больших значений параметра к малым. В реализациях нечеткой модели те же
самые переходы резкие, контрастные. Второе – однородные области в реализации нечеткой
модели имеют большие размеры, чем в реализации «Normal Score», поэтому реализация нечеткой
модели выглядит менее хаотичной. При этом вариограммы обеих реализаций одинаковые! Что это
означает? Это означает, что больший контраст значений параметра (который сам по себе ведет к
более крутой вариограмме) компенсируется большим размером однородных областей (который
сам по себе ведет к более пологой вариограмме). Другими словами, мы обнаружили два разных
типа моделей, которые соответствуют скважинам, и которые нельзя различить по гистограмме и
вариограмме. Они отличаются только характером изменения свойств. В одной модели свойства
меняются резко, в другой – плавно. Но почему мы считаем, что изменения свойств в
геологической среде должны быть плавными? Вопрос о том, какая из этих двух моделей ближе к
реальности, остается открытым.

Но мы точно знаем, что реализация нечеткой модели не опирается на интегральные


характеристики данных (гистограмму и вариограмму) и на допущение о статистической
однородности среды. Строго говоря, на вариограмму расчет реализации нечеткой модели все же
опирается, но очень незначительно – радиус вариограммы используется как предельный радиус
экстраполяции свидетельств от скважин. Этот радиус играет очень небольшую роль и только там,
где у нас малая плотность скважин. Поскольку статистические обобщения не используются, при
расчете значений APS мы легко воспроизводим локальную гистограмму в каждой области и не
получаем при этом никаких ложных эффектов. Сказанное подтверждается гистограммой и
вариограммой реализации нечеткой модели по горизонту AV1 (рис. 68). Горизонтальное сечение
реализации нечеткой модели по пласту AV1 показано на рис. 69. Оно полностью соответствует
скважинным данным.

Рис. 68. Гистограммы и горизонтальные вариограммы. Красные линии – для исходных


скважинных данных, зеленые линии – для реализации APS нечеткой модели.
Проверка для пласта AV1.

104
Рис. 69. Сравнение реализации «Normal Score» (слева) и реализации нечеткой модели
(справа) в одном и том же горизонтальном сечении пласта AV1. Цветовые палитры
одинаковы. На левой картине все красные и зеленые области находятся
исключительно между скважинами.

105
7. Стохастическая сейсмическая инверсия
Пусть коротко (без деления на параграфы), но мы должны рассмотреть такое важное приложение
геостатистики, как стохастическая сейсмическая инверсия. Сейсмической инверсией называют
задачу, когда из куба сейсмических трасс (плюс данные по некоторому числу скважин) хотят
получить куб пространственных свойств – скорости Vp, Vs, импеданс, пористость и т.д. (рис. 70).

Рис. 70. Сейсмическая инверсия (Кащеев, 2011).

Главная проблема сейсмической инверсии состоит в том, что задача обращения сейсмической
трассы является некорректной (в математическом смысле). Это означает, что малые
(микроскопические) различия в значении амплитуды на времени T ведут к большим (огромным)
различиям в значении свойств на глубине Z. В результате после инверсии двух соседних и очень
похожих трасс мы получаем два сильно различающихся вертикальных разреза (импеданса или
другого параметра). Мы полностью теряем горизонтальную непрерывность свойств. Понятно, что
такой результат нас не устраивает. Обычные средства регуляризации решения обратной задачи
(устранения некорректности) основаны на значительном понижении вертикального разрешения
модели, то есть на фактическом приближении его к разрешению сейсмических данных.

Стохастическая сейсмическая инверсия позволяет обойтись без регуляризации. С ее помощью мы


можем получать кубы свойств, близкие по вертикальному разрешению к скважинным данным и
имеющие нужную степень горизонтальной непрерывности. Плата за высокое разрешение и
непрерывность состоит в том, что вместо одного куба мы получаем много кубов (стохастических
реализаций) свойств.

Рассмотрим алгоритм стохастической инверсии применительно к расчету куба импеданса. Сначала


опишем исходное состояние. Первое – у нас есть куб реальных сейсмических трасс (после
миграции и суммирования с сохранением амплитуд). Второе – у нас есть некоторое число
скважин, на каждой из которых мы имеем вертикальный разрез импеданса, полученный с
помощью каротажа. Разрезы импеданса на скважинах мы считаем точными. Третье – у нас есть
стратиграфическая сетка. Вдоль слоев сетки мы рассчитываем горизонтальную вариограмму
импеданса по скважинным данным (это уже четвертое). Также у нас есть вертикальная
вариограмма импеданса по скважинным данным (пятое). Шестое и последнее – у нас есть форма
сейсмического импульса.

106
Суть алгоритма стохастической инверсии состоит в том, что вместо решения обратной задачи мы
много раз решаем прямую. Все шаги алгоритма показаны на рис. 71. Расчет начинается с того, что
в кубе исследуемого пространства случайным образом выбирается некоторая вертикаль. С
использованием разрезов импеданса по скважинам и вариограмм на выбранной вертикали
рассчитывается набор реализаций импеданса (допустим, 20 реализаций). Далее, применяя формулу
для коэффициента отражения от границы двух сред, по реализациям импеданса рассчитывают
трассы коэффициентов отражений. Затем эти трассы сворачиваются с сейсмическим импульсом, в
результате чего получаются 20 реализаций модельной трассы. Реализации модельной трассы
сравниваются (по тому или иному критерию) с соответствующей реальной трассой, после чего из
них выбирается наиболее близкая к реальной. Эта лучшая модельная трасса заносится в куб
модельных трасс, а породивший ее вертикальный разрез импеданса помещается в куб прогнозных
значений импеданса. Определенный таким образом разрез импеданса получает статус «разреза по
скважине». Дальше выбирается следующая случайная вертикаль, на которой все повторяется с тем
отличием, что при расчете на вертикали реализаций импеданса используется на одну скважину
больше.

Рис. 71. Алгоритм стохастической сейсмической инверсии (пояснения в тексте).

После того, как мы обойдем все точки на плане XY, у нас будет куб модельных сейсмических
трасс и куб импеданса. Горизонтальная непрерывность куба импеданса обеспечивается
использованием горизонтальной вариограммы. Однако полученный куб импеданса мы не будем
рассматривать как окончательный прогноз – мы будем рассматривать его лишь как первую
реализацию куба импеданса. Затем мы точно так же рассчитаем вторую реализацию куба
импеданса и т.д. Имея несколько реализаций, мы будем представлять степень неопределенности
нашего прогноза.

107
Отметим еще одно обстоятельство, связанное с горизонтальной вариограммой. При отходе от
скважин вертикальные реализации импеданса получают большую свободу и их изменчивость
возрастает. Увеличивая число этих реализаций (до ста и более), на удалении от скважин мы можем
добиться сколь угодно высокой степени сходства между модельной и реальной сейсмикой. Но
большого смысла в этом не будет. Почему? Дело вот в чем. Даже имея разрез импеданса по
скважине (куда уж лучше), мы не можем точно воспроизвести зарегистрированную здесь же
реальную сейсмическую трассу. Главная причина понятна – разрез импеданса на скважине
определяется в другом частотном диапазоне и характеризует другой объем среды. Есть и
дополнительные причины – мы не очень хорошо знаем форму сейсмического импульса, не
учитываем ее изменение, не можем исключить влияние обрабатывающих процедур и т.д. Из этого
вытекает, что при сейсмической инверсии не следует стремиться к точности воспроизведения
сейсмики, более высокой, чем это возможно на скважине.

Пример стохастической сейсмической инверсии показан на рис. 72.

Рис. 72. Куб скоростей Vp и данные акустического каротажа Vp по скважинам. Слева


результат детерминированной сейсмической инверсии, справа – одна из реализаций
стохастической сейсмической инверсии (Кащеев, 2011).

108
8. Использование стохастических реализаций
8.1. Использование стохастических реализаций при прокладке траектории скважины

Сейчас мы приведем еще один довод в пользу того, что множество стохастических реализаций
лучше одной детерминированной модели. Он касается случая, когда модель используется для
прокладки траектории новой скважины. Вероятность того, что одна из множества реализаций
окажется похожей на результаты бурения, несомненно выше.

На рис. 73 показан пример прокладки горизонтальной скважины с использованием трех


реализаций модели резервуара.

Рис. 73. Прокладка траектории скважины с использованием трех реализаций модели


резервуара (Ставинский и др., 2011).

109
Что мы видим на рис. 73? Сначала был произведен расчет большого числа реализаций модели и в
каждой из них подсчитаны запасы. Распределение полученных величин позволило дать
пессимистическую (P90), среднюю (P50) и оптимистическую (P10) оценку запасов. После этого из
множества реализаций модели были выбраны три, собственные значения запасов которых
находились вблизи оценок P90, P50 и P10. Выбранные реализации показаны на рис. 73. Цветовая
палитра отображает параметр NTG, голубой цвет соответствует минимуму NTG. Корректирующая
поправка к траектории скважины (выделена синим цветом) была рассчитана с учетом трех
выбранных реализаций.

8.2. Использование стохастических реализаций для адаптации геологической модели к


истории разработки

Геологическое моделирование многократно усложняется, когда мы ставим задачу адаптации


модели к истории разработки. Почему адаптация модели к истории разработки так важна?
Успешная адаптация свидетельствует о высоком качестве модели. Очевидно, что такую модель
можно использовать для прогнозирования добычи и для опробования мероприятий, направленных
на повышение эффективности добычи.

При работе с детерминированной моделью один из основных подходов к адаптации заключается в


следующем. Рассчитываемые на гидродинамическом симуляторе показатели обводненения
скважин подгоняются под фактические данные посредством изменения скин-факторов скважин.
Данная процедура вовсе не лишена смысла – коррекция скин-факторов эквивалентна коррекции
свойств резервуара (литологии, пористости, проницаемости) в некоторой окрестности скважины.
Проблема лишь в том, что мы не видим этой коррекции резервуара – мы не видим, где и насколько
мы увеличили или уменьшили качество коллектора. Соответственно, мы не можем построить
карту остаточных запасов (Шелков, Богачев, 2010).
Стохастические реализации, в сравнении с детерминированной моделью, имеют в части решения
задачи адаптации гораздо больший потенциал. Это очевидно – посредством реализаций мы как бы
прощупываем геологическую среду. Самый простой способ адаптации – рассчитать на
гидродинамическом симуляторе все реализации, после чего взять ту из них, характеристики
которой ближе к реальным показателям. Но мы расскажем о гораздо более интересном и более
сложном подходе к адаптации, основанном на использовании так называемого «множественного
фильтра Калмана (Ensemble Kalman Filter, EnKF)». Наше изложение будет следовать работе Bianco
et al., 2007.
Итак, прежде всего, вводится вектор-состояние модели yk,j

⎡ ms ⎤
yk , j = ⎢⎢ md ⎥⎥
⎢⎣ d ⎥⎦ k , j

Здесь ms – статические параметры, значения в ячейках. Если у нас 20000 ячеек, то столбец ms
будет включать 20000 значений пористости и 20000 значений проницаемости. Однако если
считать, что между пористостью и проницаемостью имеется однозначная связь, то значения
проницаемости можно не включать. Далее, md – динамические параметры в ячейках (насыщения и
давления, плюс еще 40000 значений). Наконец d – характеристики дебита скважин (например,

110
коэффициенты обводнения, по числу скважин Nd). Индекс k есть индекс вектора состояния по
времени, индекс j есть индекс реализации. Мы полагаем, что всего у нас есть Ne реализаций
модели (допустим, Ne равно 100).

При помощи гидродинамического симулятора мы можем пересчитать состояние k-1 в состояние k


(допустим, на 7 дней вперед):

ykf, j = F ( yku−1, j ) (16)

Индекс «f» означает «прогноз», про индекс «u» мы скажем чуть позже.
Поскольку у нас много реализаций, мы можем сосчитать ковариационную матрицу С fy,k (на
каждое время k). Это ковариация элементов вектора состояния друг с другом (рис. 74):


Ne

1 f f
C yf,k = (Yk f, j − Y k )(Yk f, j − Y k )T
Ne − 1
j =1

Рис. 74. Ковариационная матрица С fy,k . Пояснения в тексте.

Что можно сказать о показанной ковариационной матрице? На диагонали, как мы знаем, стоят
дисперсии (значений в реализациях). Блок «А» показывает ковариацию статических параметров
(пористости) в ячейках модели. Похожая матрица была у нас в разделе 3.2.1, но там шла речь о
точках данных, здесь – о всех ячейках модели. Если расстояние между ячейками меньше радиуса
вариограммы, соответствующий элемент матрицы C (блока «А») больше нуля, в противном
случае – равен нулю.
Элементы блока «Б» показывают ковариацию статических и динамических параметров в ячейках
модели. Элементы блока «B» показывают ковариацию статических параметров в ячейках модели и

111
дебитов скважин. Элементы блока «Г» показывают ковариацию дебитов скважин. И так далее. Все
элементы ковариационной матрицы (за исключением блока «A») связывают друг с другом
значения пористости, давления и насыщения в ячейках модели и значения дебитов скважин. Это
означает, что они являются аналогами уравнений гидродинамики. Но получили мы их
исключительно за счет статистики, то есть за счет того, что у нас есть 100 реализаций вектора
состояния.

На основании этих уравнений мы можем пересчитать отличия дебитов скважин в каждой


реализации от реальных дебитов (разницу dk – d fk,j ) в поправки к вектору состояния той же
реализации. Модельные дебиты скважин при этом притягиваются к реальным, но одновременно
вносятся необходимые поправки в значения динамических и статических параметров ячеек.
Ковариационная матрица обеспечивает корректность вносимых поправок. В частности,
вариограмма значений пористости сохраняется.
Выражение для пересчета имеет вид:

yku, j = ykf, j + K k (d k − H k ykf, j ) (17)


K k = C yf,k H kT ( H k C yf,k H kT + Cd ,k ) −1

Индекс «u» вектора состояния означает «исправленный». Матрица Cd, k есть ковариационная
матрица размера Nd x Nd, ошибок измерения реальных дебитов. Если названные ошибки
независимы, она является диагональной. Вспомогательная матрица Н имеет вид, показанный на
рис. 75. Она позволяет вырезать из ковариационной матрицы С fy, k и вектора y fk, j нужные
фрагменты.

Рис. 75. Вспомогательная матрица H.


Расчет согласно выражениям (16) и (17) выполняется попеременно. Сначала мы делаем шаг по
времени – при помощи гидродинамического симулятора пересчитываем вектор состояния на
несколько дней вперед. Названный расчет выполняется для каждой реализации. Затем
рассчитывается ковариационная матрица и с ее помощью вносятся необходимые (притягивающие
модельные дебиты к реальным) поправки в вектор состояния каждой реализации. И так далее, по
всему периоду разработки.

112
В статье, которую мы разбираем (Bianco et al., 2007), приводятся результаты опробования
алгоритма на реальных данных. Они касаются площади, включающей 10 скважин, и имеющей
историю разработки продолжительностью 1065 дней. На рис. 76 показаны кривые отношения
газ/нефть по одной из скважин. Красные кривые представляют результаты гидродинамического
расчета по исходным реализациям геологической модели, синие кривые – по уточненным. Всего
использовалось 135 реализаций. Уточненными называются реализации, полученные на последнем
шаге процесса адаптации (16) – (17). Можно видеть, что кривые, рассчитанные по уточненным
реализациям, имеют меньший разброс и лучше соответствуют реальным данным.

Рис. 76. Отношение газ/нефть по скважине A1. Точки – реальные данные. Красные
кривые – расчет по исходным реализациям резервуара. Синие кривые – расчет по
уточненным реализациям резервуара. Bianco et al., 2007.

На рис. 77 показано стандартное отклонение пористости в одном из 10-ти слоев ячеек


гидродинамической сетки. Вверху – расчет по множеству исходных реализаций. Минимумы
стандартного отклонения – области синего и голубого цвета – соответствуют расположению
скважин (серые точки; всего, как мы сказали, 10 скважин). Похожая карта была у нас на рис. 25
(справа). За пределами радиуса горизонтальной вариограммы (от скважин) стандартное
отклонение достигает максимума. Внизу – расчет по уточненным реализациям. Можно видеть, что
после уточнения реализации пористости стали ближе друг к другу. В одной из областей их
сближение столь велико, что соответствует эффекту от бурения дополнительной скважины.

113
Рис. 77. Стандартное отклонение пористости в слое ячеек гидродинамической сетки.
Вверху – расчет по исходным реализациям. Внизу – расчет по уточненным
реализациям. Bianco et al., 2007.

Описанный пример вполне достоин того, чтобы закончить на нем нашу книгу. Но мы очень
коротко упомянем еще одну статью. Она описывает международный проект-соревнование в сфере
геологического и гидродинамического моделирования (Peters et al., 2009). Участникам проекта
были предложены данные в отношении площади «Brugge». Они включали результаты разработки
за первые 10 лет добычи (30 скважин, из них 10 нагнетательных и 20 добывающих), 104
стохастические реализации модели на гидродинамической сетке (60000 ячеек), а также давления и
насыщения по данным 4D сейсмики.

И сама площадь «Brugge», и все данные в ее отношении были синтезированы искусственно.


Исходная (скрытая от участников проекта) модель включала 20 миллионов ячеек. Задача, которую
ставили организаторы соревнования, состояла в следующем. Требовалось, используя
предоставленную историю разработки, уточнить исходные реализации модели и рассчитать
оптимальную стратегию заводнения на 20 лет вперед. Предложенные стратегии проверялись на
истинной модели, после чего победитель определялся по экономическим показателям (цена на
нефть тоже была задана).

114
В таблице 2 перечислены участники проекта «Brugge» и методы адаптации модели к истории
разработки, которые они применяли. Что мы хотим показать, помещая эту таблицу? Во-первых,
мы хотим показать, кто сегодня является элитой в сфере геологического моделирования. Во-
вторых, мы хотим показать, что значительная часть участников проекта использовала подход к
адаптации на основе множественного фильтра Калмана (который мы только что разобрали).

Табл. 2. Участники проекта «Brugge» и использованные ими методы адаптации модели к


истории разработки (Peters et al., 2009).

Кто победил в проекте «Brugge»? Об этом вы при желании прочитаете сами. Скажу лишь то, что
разница между наиболее успешной и наименее успешной стратегиями разработки (по итогам 20-ти
лет, на одной площади с тремя десятками скважин) составила 0.4 миллиарда долларов. То есть мы
видим, какова цена знаний по геостатистике.

115
Заключение и благодарности
Подведем, наконец, окончательные итоги. Разумеется, работа не свободна от недостатков. Крайне
мал список литературы. Не упоминается имя основателя геостатистики Жоржа Матерона (и
многие другие достойные имена). Некоторым описаниям не хватает математической строгости.
Имеются пропуски. Отдельные вопросы изложены субъективно. Но мне самому, то, что
получилось, (субъективно) нравится.

Что еще я могу сказать в этой связи? На все остальные претензии я отвечу афоризмом нашего
директора А.С. Кашика: «Если я убеждаюсь, что чего-то не понимаю, я счастлив!»

У А.С. Кашика есть и второй афоризм: «Сделать за деньги не достижение, достижение – сделать
без денег!» Этот второй афоризм нравится далеко не всем. Тем не менее, он многое определяет в
атмосфере компании. Не думаю, что смог бы подготовить данную работу вне ЦГЭ. Хочу
высказать свою благодарность за многолетнюю поддержку (иногда – просто эмоциональную, но
очень часто – реальную) А.С. Кашику, Г.Н. Гогоненкову, С.Б. Денисову, С.И. Билибину,
Т.Ф. Дьяконовой.

Основная часть примеров, показанных в данной книге, подготовлена в программной системе DV-
Geo. Многолетнее упорство ЦГЭ в разработке собственной системы геологического
моделирования позволяет нам смотреть на мировых грандов (см. таблицу на предыдущей
странице) не снизу-вверх, а как на коллег-соперников. Считаю необходимым назвать тех, кто
делает систему DV-Geo. Руководитель разработки – М.В. Перепечкин, ответственная за
разработку интерфейсов – Е.А. Духанова, главный тестировщик – И.А. Глобенко, разработчик
геостатистического модуля – Д.И. Матросов. Я счастлив, что также являюсь членом этой группы.

Некоторые важные примеры, из числа показанных в книге, были заимствованы. Я благодарен


Д.Е. Кащееву (ОАО «ЦГЭ») и П.В. Ставинскому (ОАО НК «Роснефть») за предоставленные
материалы.

В ходе написания мне очень пригодился преподавательский опыт. Хочу поблагодарить


С.Б. Турунтаева (МФТИ) и А.В. Петрова (РГГРУ) за возможность работы со студентами
названных университетов.

И последнее. Я благодарен EAGE за предложение написать данную работу. Все сотрудники


EAGE, с которыми я встречался и сотрудничал в этой связи (Питер Вервей, Ремко Бакс, Владимир
Зуев, Юрий Петраченко) произвели на меня впечатление людей, реально осуществляющих
интеграцию российских геологов и геофизиков в мировую научную среду.

116
Ссылки
1. Bianco, A., Cominelli, A., Dovera, L., Naevdal, G., Valles, B., 2007, History Matching and Production
Forecast Uncertainty by Means of the Ensemble Kalman Filter – A Real Field Application, SPE-107161,
10 p.

2. Chiles, J.P., Delfiner, P., 1999, Geostatistics. Modeling Spatial Uncertainty, Wiley Series in Probability
and Statistics, Wiley & Sons, 695 p.

3. Daly, C., Caers, J. 2010, Multi-point geostatistics – an introductory overview, First Break, Vol. 28, No.
9, p. 39-47.

4. Deutsch, C.V., and Journel, A.G., 1992, GSLIB, Geostatistical Software Library and User's Guide,
New-York, Oxford University Press, 340 p.

5. Doyen, P.M., 1988, Porosity from Seismic Data: A Geostatistical Approach, Geophysics, Vol. 53, No.
10, p. 1263-1275.

6. Dubrule, O., 2003, Geostatistics for seismic data integration in earth models: SEG Distinguished
Instructor Series No. 6. (В 2005 году вышел перевод данной книги на русский язык, 296 с.)

7. Gordon, J., Shortliffe, E., 1985, A method for managing evidential reasoning in a hierarchical
hypothesis space, Artificial Intelligence, Vol. 26, p. 323-357.

8. Kovalevskiy E.V., 2007, Fuzzy geological model. Petroleum Geostatistics, Cascais, Portugal.

9. Peters, E., Arts, R.J., Brouwer, G.K., Geel, C.R., 2009, Results of the Brugge Benchmark Study for
Flooding Optimization and History Matching, SPE-119094, 21 p.

10. Демьянов В.В., Савельева Е.А., 2010, Геостатистика, теория и практика. Москва, Наука, 327 с.

11. Кащеев Д.Е., 2010, Стохастические технологии сейсмической инверсии, прогноза


коллекторских свойств. Тезисы докладов геофизической конференции «Санкт-Петербург 2010».

12. Ковалевский Е.В., Перепечкин М.В., 2011, Нечеткая геологическая модель. Препринт доклада
на конференции «Инновации в нефтяной геологии и геофизике», ОАО «ЦГЭ», 7-8 апреля 2011 г.

13. Ставинский П.В., Левин Д.Н., Прудников А.А., Бирун Е.М., 2011, Методика и результаты
анализа неопределенностей и рисков при оценке запасов и планировании бурения скважин. Тезисы
докладов геофизической конференции ЕАГО «Сочи-2011».

14. Шелков В.Г., Богачев К.Ю., 2010, Новый подход для реалистичного моделирования трещин
ГРП и техногенных трещин на полномасштабных гидродинамических моделях, SPE-138071,
Российская нефтегазовая конференция и выставка SPE, Москва.

117
14549-SLT RU handout.indd 2 09-09-11 10:20