Улучшенный метод трёхмерной реконструкции трещин на основе сегментации суперпикселями и свёрточной нейронной сети

Морфология и связность подземных сетей трещин являются критическими факторами, контролирующими устойчивость ствола скважины и эффективность гидравлического разрыва пласта. Точная характеристика трёхмерной сложности трещин имеет существенное значение для обеспечения инженерной безопасности и повышения производительности. В данном исследовании разработана новая модель сегментации изображений. Она улучшает итеративный пороговый метод за счёт включения простых линейных итеративных кластеризующих суперпикселей (SLIC), архитектуры ResNet50 и модели гауссовой смеси (GMM). Модель сначала разделяет сложные изображения компьютерной томографии (КТ) на многочисленные суперпиксельные изображения с помощью сегментации суперпикселями SLIC. Затем ResNet50 используется для классификации этих суперпиксельных изображений. На основе результатов классификации метод итеративной пороговой сегментации применяется для сегментации различных категорий суперпиксельных изображений. После предварительной сегментации изображений модуль гауссовой смеси используется для удаления шума с сегментированных изображений трещин, в результате чего получаются высокоточные сегментированные изображения. Двумерные сегментированные изображения затем реконструируются в трёхмерном пространстве, и анализируются трёхмерные распределительные характеристики трещин. Данное исследование приходит к выводу, что новый метод сегментации трещин позволяет высокоточное извлечение областей трещин. По сравнению с пороговой сегментацией, значение шума морфологического анализа в двумерных изображениях, сегментированных методом, предложенным в данном исследовании, снизилось с 0,21% до 0,08%. Распределение трещин в трёхмерном пространстве является сложным, и области с более крупными сетями трещин демонстрируют большую сложность в их трёхмерном распределении.

1. Введение

Точная идентификация и трёхмерная количественная характеристика трещин являются критическими основами для оценки нефтегазовых коллекторов и принятия инженерных решений. С широким внедрением технологии микро/нано-КТ, исследования трещин на основе цифровых кернов стали передовым направлением в физике горных пород и инженерной геологии. Текущие исследования в основном сосредоточены на трёх последовательно развивающихся этапах: точная сегментация и извлечение информации о трещинах из изображений, трёхмерная пространственная реконструкция сетей трещин и многошкальная структурная количественная характеристика на основе реконструированных моделей [1–4]. Несмотря на значительный прогресс на каждом этапе, остаются проблемы в точности, автоматизации и глубокой интеграции физического смысла.
На этапе сегментации изображений ключевая задача заключается в точном извлечении микромасштабных, морфологически разнообразных структур трещин из КТ-изображений, характеризующихся низким отношением сигнал/шум, неравномерной градацией серого и частыми минеральными помехами. Традиционные методы, такие как пороговая сегментация и обнаружение границ, обеспечивают высокую вычислительную эффективность, но обладают высокой чувствительностью к качеству изображения и предварительной обработке, что часто приводит к избыточной сегментации или фрагментации в сложных фонах [5–8]. Исследование Хэ и др. сравнивало результаты идентификации трещин моделей, таких как VGG19, VGG16 и Weka3D. Результаты показали, что VGG16 и VGG19 достигли более высокой точности, причём обе модели достигли точности идентификации 0,81 [5]. В последние годы подходы на основе машинного обучения постепенно стали доминирующими. Модели контролируемого обучения, обученные на вручную спроектированных текстурных и градационных признаках, превосходят традиционные методы. Однако их зависимость от инженерии признаков ограничивает их обобщающую способность [9–11]. Текущие исследования всё больше фокусируются на глубоком обучении, в частности на архитектурах кодировщик–декодировщик на основе U-Net и их вариантах. Эти модели могут автоматически обучаться многошкальным контекстным признакам, значительно улучшая распознавание сложных границ трещин и слабых сигналов [12–14]. Ван и Юнь выполнили сегментацию изображений горных пород с использованием сети U-net. Результаты показали, что точность бинарной сегментации U-net может достигать 99,87% [12]. На основе существующих глубоких свёрточных нейронных сетей улучшенные модели, включающие передовые модули, такие как свёртки с раздельной глубиной и механизмы внимания, могут оптимизировать вычислительную эффективность при сохранении точности и улучшении фокусировки на критических областях трещин [15–17]. Однако такие методы сильно зависят от больших объёмов высококачественных, точно аннотированных обучающих выборок. Аннотация изображений трещин кернов чрезвычайно затратна и часто субъективна.
В области трёхмерной реконструкции структуры горных пород исследования эволюционировали от простой визуализации к точной количественной оценке. Хотя стандартный процесс 3D-реконструкции включает наложение серий бинарных изображений, топологические ошибки, такие как ложные разрывы, ложные соединения и пространственные несоответствия, остаются основными проблемами. Эти ошибки часто вызваны отклонениями регистрации изображений, несоответствиями в межсрезной сегментации или шумом [18–21]. Текущие исследования используют анизотропную диффузионную фильтрацию, глубокие свёрточные нейронные сети, алгоритмы интерполяции на основе морфологии или модели марковских случайных полей для оптимизации межсрезной согласованности. Эти подходы направлены на восстановление непрерывности и пространственной когерентности сетей трещин [22–26]. Архитектуры, представленные 3D-свёрточными нейронными сетями и их вариантами, используют трёхмерные свёрточные ядра для непосредственной обработки объёмных данных изображений. Эти модели могут автоматически обучаться и интегрировать трёхмерную пространственную контекстную информацию, демонстрируя превосходную точность и робастность по сравнению с традиционными методами в задачах идентификации сложных пор и сегментации мульти-минеральных фаз [27–29]. Для трёхмерной реконструкции обычно применяются алгоритмы морфологической интерполяции и методы интерполяции на основе поля расстояний для заполнения недостающей информации между срезами и сглаживания поверхностей. Эти подходы показывают перспективную применимость для восстановления более сложных топологических структур [30–32]. Эффективность трёхмерной реконструкции для изображений трещин горных пород существенно зависит от метода сегментации изображений. Следовательно, точность сегментации является критическим фактором для успешной 3D-реконструкции.
Таким образом, для устранения недостатков текущих исследований в данном исследовании интегрированы сегментация суперпикселями SLIC, распознавание изображений ResNet50 и GMM для улучшения итеративного порогового метода сегментации, тем самым устанавливая подход сегментации изображений SRTG. Метод применяет сегментацию суперпикселями SLIC к КТ-изображениям горных пород, за которой следует классификация на основе ResNet50 для направленной пороговой сегментации. Наконец, GMM удаляет шум из результатов, обеспечивая высококачественное извлечение трещин.

2. Методы

Для трёхмерной реконструкции трещин на основе КТ-изображений точная сегментация и извлечение трещин из двумерных КТ-изображений являются необходимыми. В данном исследовании предлагается модель SRTG с множественными улучшениями для достижения высокоточной сегментации и извлечения трещин. Модель сначала разделяет исходное изображение на несколько суперпиксельных областей с помощью сегментации суперпикселями SLIC. Затем ResNet50 используется для распознавания и классификации этих суперпиксельных областей. Затем применяется метод итеративной пороговой сегментации для извлечения областей трещин в каждой суперпиксельной области. Наконец, кластеризация GMM используется для удаления шумовых пикселей из изображения, в результате чего получается полная и уточнённая область трещины.

2.1. Итеративная пороговая сегментация

Алгоритм итеративной пороговой сегментации — это автоматизированный метод, который постепенно приближается к оптимальному глобальному порогу изображения через механизм самообратной связи. Его основная идея происходит из предположения о бимодальной характеристике гистограммы изображения, означающей, что значения градаций серого пикселей целевого объекта и фона должны формировать два разделимых распределения. Посредством итеративных вычислений алгоритм обеспечивает, чтобы окончательно определённый порог мог максимально разделять эти две категории, тем самым достигая адаптивной бинаризации без ручного вмешательства. Этот метод обычно не зависит от локальных статистических характеристик изображения, а рассматривает изображение как целое для поиска оптимального глобального порога сегментации. Поэтому он особенно эффективен для изображений с чёткими бимодальными гистограммами.
Процесс выполнения алгоритма следует типичной процедуре итеративной оптимизации. Сначала выбирается начальный порог T0, часто выбираемый как медиана или среднее значение градации серого всего изображения. Затем, на основе этого порога, пиксели изображения делятся на два набора: передний план и фон. Затем отдельно вычисляются средние значения градаций серого этих двух наборов. Используя эти вычисленные средние значения градаций серого, генерируется новый порог, на котором начинается следующая итерация. Этот процесс продолжается до тех пор, пока порог не сойдётся к стабильному значению.
T0 = (1/N) ∑x,y T(x,y)(1)
T1 = ½(T′ + T″)(2)
где N — количество пикселей в изображении, T(x,y) представляет значение градации серого пикселя в координатах (x,y), а T1 обозначает порог, используемый во втором раунде пороговой сегментации.

2.2. Сегментация суперпикселями SLIC

Алгоритм сегментации суперпикселями SLIC стал широко применяемым методом в цифровой обработке изображений благодаря высокой вычислительной эффективности, сильной устойчивости к шуму и простой конфигурации параметров. Основная идея этого алгоритма заключается в разбиении изображения на набор пространственно смежных и внутренне однородных суперпиксельных областей, тем самым заменяя традиционную попиксельную обработку. Посредством этого суперпиксельного представления структурная и текстурная информация изображения может быть охарактеризована более эффективно.
Алгоритм SLIC фундаментально работает как метод кластеризации, группируя N пикселей в исходном изображении в k суперпикселей. На этапе инициализации необходимо установить два ключевых параметра: количество суперпикселей, k, и параметр компактности, m. Параметр компактности m регулирует регулярность форм суперпикселей: большее значение m приводит к более компактным и регулярным суперпиксельным областям, тогда как меньшее значение m приводит к более нерегулярным формам суперпикселей.
После установки параметров алгоритм проходит множественные итерации оптимизации. В каждой итерации вычисляется расстояние между каждым пикселем и центрами соседних суперпикселей. Если это расстояние меньше, чем текущее записанное минимальное расстояние, минимальное расстояние обновляется, и пиксель переназначается соответствующему суперпикселю. Это расстояние состоит из взвешенной комбинации цветового расстояния (Уравнение (4)) и пространственного расстояния (Уравнение (5)). Вычисление цветового расстояния требует преобразования исходного изображения RGB в цветовое пространство Lab. Цветовое пространство Lab включает три компонента: L представляет светлоту (от 0 до 100), a представляет цветовой компонент от зелёного к красному (−128 до 127), а b представляет цветовой компонент от синего к жёлтому (−128 до 127). Пространственное расстояние измеряет позиционную разницу в пикселях на плоскости изображения [33].
d = √(dc2 + (ds · m / (N/k))2)(3)
dc(i,j) = √((lj−li)2 + (aj−ai)2 + (bj−bi)2)(4)
ds(i,j) = √((xj−xi)2 + (yj−yi)2)(5)
где lj, aj и bj — значения цвета Lab центра суперпикселя; xj и yj — координаты центра суперпикселя; dc, ds и d представляют цветовое расстояние, пространственное расстояние и общее расстояние между пикселем и окружающими центрами суперпикселей соответственно.

2.3. ResNet50

ResNet50 — это модель глубокой свёрточной нейронной сети, основанная на механизмах остаточного обучения, предназначенная для решения проблем деградации производительности и распространения градиентов при обучении глубоких сетей. В традиционных глубоких нейронных сетях увеличение глубины может приводить к насыщению или даже снижению точности. ResNet инновационно вводит структуру «пропускаемого соединения», позволяя сети обучаться остатку между входом и выходом, а не непосредственно аппроксимировать целевое отображение. Этот подход добавляет исходную входную информацию непосредственно к обработанным результатам свёрточных слоёв в качестве выхода. Во время обратного распространения этот дизайн создаёт беспрепятственный путь для градиента, обеспечивая эффективное распространение и обновление градиентов в глубоких сетях во время обучения. Следовательно, становится возможным построение сетей со значительной глубиной при существенном повышении способности модели к представлению признаков и стабильности сходимости.
В процессе вычислений ResNet-50 оптимизирует количество параметров и вычислительную эффективность через свою структуру «бутылочного горлышка». Основная часть сети состоит из четырёх стадий, каждая из которых содержит несколько остаточных блоков. Каждый остаточный блок использует трёхслойную свёрточную комбинацию свёрток 1×1, 3×3 и 1×1: сначала свёртка 1×1 уменьшает размерность признаков для снижения вычислительных затрат; затем свёртка 3×3 извлекает пространственные признаки; наконец, ещё одна свёртка 1×1 восстанавливает размерность, и результат добавляется к входу из пропускаемого соединения (Рисунок 1).

2.4. Модуль гауссовой смеси (GMM)

GMM — это метод кластеризации, основанный на статистической вероятностной структуре, фундаментальной моделью которого является модель гауссовой смеси. Этот метод предполагает, что наблюдаемые выборки данных генерируются из линейной комбинации нескольких многомерных гауссовых распределений, каждое из которых соответствует потенциальному кластеру. Алгоритм оценивает параметры через процесс ожидания-максимизации (EM): на шаге ожидания вычисляется апостериорная вероятность принадлежности каждой выборки к каждому компоненту, тогда как на шаге максимизации обновляются векторы средних, ковариационные матрицы и коэффициенты смешивания каждого компонента на основе этих вероятностных весов. Модель обучает параметры путём максимизации функции правдоподобия и в конечном счёте назначает выборки компоненту с наивысшей апостериорной вероятностью согласно байесовской теории принятия решений. Этот метод может захватывать сложные топологические структуры распределений данных и особенно подходит для идентификации кластеров с различной плотностью и ковариационными структурами.
Распределение гауссовой смеси состоит из K гауссовых распределений, смешанных вместе, и модель может быть выражена следующим образом:
p(x) = ∑k=1K πk N(x | μk, Σk)(6)
N(x | μk, Σk) = (1 / √((2π)D |Σ|)) exp(−½ (x−μ)⊺ Σ−1 (x−μ))(7)
где πk представляет коэффициент смешивания k-го компонента, N(x | μk, Σk) обозначает плотность вероятности k-го гауссова распределения, K — общее количество гауссовых компонентов в смеси, D — размерность данных, а Σ — определитель ковариационной матрицы.
Модель GMM начинается с инициализации среднего, коэффициента смешивания и ковариации для каждого гауссова распределения. Для каждой точки данных вычисляется апостериорная вероятность принадлежности к каждому гауссову распределению на основе текущего распределения параметров:
γik = (πk N(xi | μk, Σk)) / (∑j=1K πj N(xi | μj, Σj))(8)
На основе апостериорных вероятностей среднее, ковариация и коэффициент смешивания каждого гауссова распределения обновляются следующим образом:
Nk = ∑i=1N γik(9)
μk = (1/Nk) ∑i=1N γik xi(10)
Σk = (1/Nk) ∑i=1N γik (xi−μk)(xi−μk)⊺(11)
πk = Nk / N(12)
где N представляет общее количество точек данных.
Вышеуказанные шаги повторяются итеративно. В каждой итерации апостериорные вероятности принадлежности каждой выборки к каждому компоненту вычисляются на основе текущих параметров, и впоследствии среднее, ковариация и коэффициенты смешивания каждого гауссова компонента переоцениваются с использованием этих вероятностей. Этот процесс продолжается до сходимости параметров, давая окончательную модель кластеризации. На основе этой модели шумовые пиксели и пиксели трещин кластеризуются после сегментации, в результате чего получается высокоточная область трещины.

2.5. Модель SRTG

SRTG — это метод сегментации и извлечения трещин, интегрирующий сегментацию суперпикселями SLIC, распознавание изображений ResNet50, пороговую сегментацию и удаление шума гауссовой кластеризацией (Рисунок 2). Процесс сначала делит исходное КТ-изображение на несколько суперпиксельных областей с помощью сегментации SLIC. Размер и форма суперпиксельных областей не являются однородными, поскольку их разделение в первую очередь опирается на сходство локальных пикселей в изображении. Суперпиксельные изображения, полученные в результате сегментации SLIC, имеют нерегулярную форму, но цифровая обработка изображений обычно работает с прямоугольными изображениями. Поэтому в данном исследовании пустые области заполняются белым цветом для преобразования суперпиксельных изображений в регулярные прямоугольники.

Суперпиксельные изображения после сегментации SLIC могут быть разделены на три типа: изображения, не содержащие пикселей трещин (не-трещинные изображения), изображения, содержащие частичные пиксели трещин (частично-трещинные изображения), и изображения, состоящие полностью из пикселей трещин (трещинные изображения). Различные типы суперпиксельных изображений требуют различных подходов к обработке: не-трещинные изображения непосредственно отбрасываются, трещинные изображения непосредственно извлекаются как часть области трещины, а частично-трещинные изображения требуют пороговой сегментации для определения областей трещин внутри них. В данном исследовании используется ResNet50 для автоматического распознавания трёх типов суперпиксельных изображений, обеспечивая необходимые предпосылки для последующей сегментации и извлечения трещин.
После завершения идентификации суперпиксельных изображений итеративная пороговая сегментация применяется к полу-трещинным изображениям. Поскольку каждая суперпиксельная область вычисляет свой порог сегментации индивидуально, а площадь суперпиксельных изображений относительно мала, становится легче определить подходящий порог для сегментации трещин. По завершении извлечения трещин внутри суперпиксельных изображений выполняется обратная операция SLIC для реконструкции полного изображения трещины из извлечённых сегментов. После этой серии шагов сегментации небольшое количество шумовых пикселей может всё ещё оставаться в изображении. Затем GMM используется для классификации целевых пикселей в изображении на две категории: области трещин и не-трещинные области, тем самым удаляя шумовые пиксели и получая полную область трещины.

2.6. Трёхмерная реконструкция трещин

Большое количество двумерных бинарных последовательностей изображений трещин, обработанных посредством пороговой сегментации, пространственно располагаются вдоль направления, перпендикулярного плоскости среза (определённого как ось z), для построения начальных трёхмерных объёмных данных. Пространственное разрешение этих объёмных данных определяется разрешением в плоскости ∆x и ∆y исходных КТ-изображений, а также расстоянием между срезами ∆z.
Реконструированные трёхмерные трещины могут демонстрировать локальные разрывы. Для решения этой проблемы к бинарным объёмным данным применяется трёхмерная морфологическая операция замыкания для заполнения зазоров и регуляризации границ. Эта операция сначала расширяет области трещин через дилатацию для соединения разорванных участков на смежных срезах (Уравнение (13)), за которой следует шаг эрозии для сжатия чрезмерно расширенных областей и восстановления морфологии границ (Уравнение (14)).
(V ⊕ S)(x,y,z) = max(i,j,k)∈S V(x−i, y−j, z−k)(13)
(V ⊖ S)(x,y,z) = max(i,j,k)∈S V(x+i, y+j, z+k)(14)
где V(x,y,z) представляет трёхмерные бинарные объёмные данные (с областями трещин, помеченными как 1, и матрицей как 0), S обозначает трёхмерный структурный элемент, определяющий диапазон связности окрестности, а (i,j,k) — смещённые координаты внутри структурного элемента.

2.7. Методы оценки

КТ-изображения горных пород часто содержат два типа шума после сегментации: изолированные ошибочно классифицированные точки и небольшие неструктурные области. Точная оценка этих шумов имеет решающее значение для последующего анализа сети трещин. В данном исследовании решается проблема оценки шума в бинарных сегментированных КТ-изображениях горных пород путём предложения трёх неконтролируемых методов оценки, не требующих аннотаций истинности: анализ связных компонентов (CCA), морфологический анализ (MA) и анализ локальной согласованности (LCA). Эти методы количественно оценивают уровни шума в результатах сегментации с разных точек зрения, предоставляя количественную основу для контроля качества сегментации трещин горных пород.
Анализ связных компонентов помечает бинарные изображения с использованием связности 8-окрестности, вычисляет площадь каждой связной области и классифицирует бинаризованные пиксели в изображении на шумовые пиксели и не-шумовые пиксели на основе порога площади. Затем вычисляется доля шумовых пикселей следующим образом:
RC = (∑i=1N Ni · Ai / ∑i=1N Ai) × 100%(15)
где RC представляет процент шумовых пикселей, полученный методом анализа связных компонентов, N обозначает общее количество пикселей в изображении, Ni указывает результат порогового суждения (где шумовым областям присваивается значение 1, а другим областям — 0), а Ai относится к площади i-й пиксельной области.
Морфологический анализ основан на предположении о характеристиках формы: реальные трещины демонстрируют удлинённые, изогнутые геометрические формы (низкая круглость), тогда как шумовые точки имеют тенденцию быть изотропными (высокая круглость). Круглость вычисляется следующим образом:
C = (4πA / P2) × 100%(16)
где A представляет площадь области, а P обозначает периметр.
Анализ локальной согласованности основан на предположении о корреляции окрестности: реальные пиксели трещин демонстрируют высокую пространственную корреляцию со своими соседними пикселями, тогда как шумовые пиксели имеют тенденцию быть локально изолированными. Этот метод идентифицирует изолированные шумовые точки путём количественной оценки силы связности между каждым пикселем трещины и его окружающей окрестностью. Он особенно эффективен для обнаружения ошибочно классифицированных пикселей, которые могут формировать небольшие связные компоненты, но по существу лишены структурной непрерывности. Анализ локальной согласованности эффективно дополняет ограничения анализа связных компонентов, особенно в идентификации изолированных пикселей около концов или пересечений трещин. Такие пиксели могут превышать пороги площади, но демонстрировать аномальную пространственную связность.

3. Результаты

В Разделе 2 данное исследование предлагает метод сегментации и извлечения двумерных трещин SRTG, основанный на сегментации суперпикселями SLIC, распознавании изображений ResNet50, пороговой сегментации и модели гауссовой смеси, и впоследствии выполняет трёхмерную реконструкцию трещин. Данный раздел в первую очередь применяет предложенные методы сегментации двумерных трещин и трёхмерной реконструкции трещин. Математические модели, соответствующие результатам в данном разделе, представлены в Разделе 2. В данном исследовании всего 1019 КТ-изображений трещин были собраны из одной и той же керновой пробки. Двадцать изображений трещин были случайно выбраны, и области трещин в этих изображениях были вручную откалиброваны на основе экспертного опыта для последующей оценки производительности сегментации изображений.
В операционной среде алгоритма, использованного в данном исследовании, ЦПУ — Intel(R) Xeon(R) CPU E3-1505M v5 @ 2.80 ГГц, а ГПУ — Intel(R) HD Graphics P530. Алгоритм был реализован с использованием языка программирования Python 3.9, в первую очередь опираясь на фреймворк PyTorch 1.6.0.

3.1. Сегментация SLIC и распознавание суперпиксельных изображений

После получения стандартного образца керна 1019 двумерных изображений трещин были получены посредством трёхмерного сканирования КТ. КТ-изображения керна — это трёхмерные цифровые представления внутренней структуры горных пород, полученные посредством сканирования компьютерной томографией, где информация о градациях серого отражает вариации плотности среди внутренних компонентов горной породы. Различные микроструктуры могут быть чётко идентифицированы на изображениях. Системы трещин обычно проявляются как непрерывные или прерывистые тёмные полосы со значительно более низкими значениями КТ, чем окружающая матрица. Различные минералы проявляются как области различной яркости в зависимости от их атомных номеров и плотностей (Рисунок 3).

Рисунок 3. Исходное КТ-изображение.

Количество суперпикселей, k, в сегментации суперпикселями SLIC существенно влияет на результаты сегментации (Рисунок 4). Дополнительно параметр компактности непосредственно влияет на форму сегментированных суперпиксельных изображений. В определённом диапазоне увеличение количества суперпикселей k и уменьшение компактности m могут улучшить сегментацию пикселей трещин. Однако когда эти параметры достигают определённого порога, дальнейшие изменения оказывают минимальное влияние на сегментацию пикселей трещин. В данном исследовании параметры k и m количественно оцениваются на основе сложности распознавания сегментированных суперпиксельных изображений. Оптимальные значения для k и m определяются, когда ResNet50 достигает наивысшей точности распознавания для сегментированных суперпиксельных областей.

Рисунок 4. Сегментация суперпикселями SLIC.

Различные комбинации параметров суперпикселей приводят к различным суперпиксельным изображениям, приводя к значительным вариациям в точности распознавания ResNet50 для этих изображений. Поскольку суперпиксели трещин, частично-трещинные суперпиксели и не-трещинные суперпиксели демонстрируют относительно отчётливые признаки, общая точность распознавания, как правило, высока. Однако заметные различия в точности распознавания всё ещё существуют для различных комбинаций параметров. Среди трёх типов суперпиксельных изображений частично-трещинные суперпиксели являются наиболее сложными для распознавания. Поэтому параметры SLIC k и m определяются на основе общей точности распознавания суперпиксельных изображений и точности распознавания специально для частично-трещинных суперпиксельных изображений (Уравнения (3)–(5)). Когда k < 2000, точность распознавания суперпиксельных изображений, как правило, увеличивается по мере роста k. Когда k > 2000, дальнейшее увеличение k не приводит к значительному улучшению точности распознавания. Учитывая, что количество суперпикселей существенно влияет на вычислительное время, в данном исследовании принимается k = 2000 после комплексной оценки. Параметр компактности m в первую очередь влияет на форму суперпиксельных областей. Меньшее m приводит к более нерегулярным формам суперпикселей, но точность распознавания не демонстрирует чёткой закономерности с увеличением m. Чрезмерно большое m может привести к чрезмерно регулярным суперпиксельным областям, препятствуя точной сегментации областей трещин, тогда как чрезмерно малое m может внести фоновый шум и снизить точность распознавания. После множественных экспериментов выбирается m = 6 (Рисунок 5). Когда k = 2000 и m = 6, обработка одного КТ-изображения занимает 11,8 с в данной вычислительной среде. ResNet50 занимает 10,2 с на изображение для идентификации суперпиксельных областей в каждом КТ-изображении.

Рисунок 5. Сегментация суперпикселями SLIC. (Слева): Все суперпиксели, (Справа): Частично-трещинные.

3.2. Двумерная сегментация трещин с использованием SRTG

После завершения сегментации суперпикселями SLIC и идентификации суперпиксельных изображений различные типы суперпиксельных изображений требуют различных подходов к обработке. Для суперпиксельных изображений, состоящих полностью из пикселей трещин, все пиксели внутри изображения непосредственно идентифицируются как пиксели трещин. Для суперпиксельных изображений, не содержащих пикселей трещин, предполагается, что ни один из пикселей не принадлежит пикселям трещин, и такие изображения могут быть полностью отброшены. Для суперпиксельных областей, которые содержат как пиксели трещин, так и не-трещинные пиксели, пиксели трещин извлекаются с использованием метода сегментации изображений SRT (улучшенная пороговая сегментация на основе SLIC и ResNet50), предложенного в данном исследовании. После сегментации и извлечения пикселей трещин из суперпиксельных изображений шумовые пиксели в изображении удаляются на основе подхода гауссовой кластеризации, интегрированного в метод SRTG, в результате чего получаются высокоточные области трещин (Рисунок 6).

Рисунок 6. Сравнение методов сегментации КТ-изображений.

В данном исследовании количественно характеризуется шум в сегментированных двумерных изображениях на основе методов оценки шума для 2D-изображений (CCA, MA, LCA), предложенных в Разделе 2.7, тем самым сравнивая преимущества и недостатки различных методов сегментации изображений. Распределение шума после сегментации с использованием различных методов сегментации изображений показано на Рисунке 7. Поскольку изолированные шумовые пиксели не чётко видны на изображении, шумовые пиксели на Рисунке 7 являются увеличенными представлениями, в первую очередь иллюстрирующими области распределения шумовых пикселей, а не их фактические площади. В сегментированных изображениях шум в основном сконцентрирован около трещин, поскольку значения градаций серого пикселей в этих областях ближе к значениям трещин, делая их более склонными к ошибочной классификации как пиксели трещин. С точки зрения распределения шума, уровни шума после сегментации с использованием двух улучшенных методов сегментации изображений, SRT и SRTG, значительно ниже, чем после исходного метода пороговой сегментации.

Рисунок 7. Распределение шума после сегментации изображений.

CCA, MA и LCA могут интуитивно анализировать шумовые пиксели в изображениях, но для общей сегментации изображений особенно важна доля шума в сегментированном изображении. Отношение шума может количественно отражать количество шума в изображении. На основе CCA, MA и LCA шум в сегментированных изображениях дополнительно анализируется путём вычисления доли шумовых пикселей, обнаруженных с использованием различных методов. Вычисления показывают, что два улучшенных метода сегментации изображений значительно снижают долю шума в изображениях. Для результатов сегментации как SRT, так и SRTG доля шумовых пикселей, обнаруженных тремя методами оценки, составляет ниже 0,1%. Хотя отношения шума, вычисленные различными методами оценки, незначительно различаются, все три метода указывают, что метод сегментации изображений SRTG даёт наименьшую долю шума, демонстрируя, что метод сегментации SRTG достигает более высокой точности сегментации (Рисунок 8).

Рисунок 8. Анализ доли шумовых пикселей.

3.3. Результаты трёхмерной реконструкции трещин

На основе результатов двумерной сегментации трещин из последовательности КТ-сканирования керна в данном исследовании применяется технология трёхмерной пространственной реконструкции для достижения трёхмерной визуализации и характеристики структур трещин. Путём пространственной регистрации и наложения бинаризованных изображений трещин, извлечённых из последовательных срезов, строится трёхмерная цифровая модель трещин с пространственной непрерывностью. Эта модель не только сохраняет морфологические характеристики трещин в пределах двумерной плоскости, но и улучшает выражение непрерывности трещин в трёхмерном пространстве посредством продольной интерполяционной обработки. Используя технику цветового отображения тепловой карты, различным цветам назначаются на основе доли пикселей трещин в каждом срезе, визуально представляя паттерны распределения плотности трещин вдоль направления глубины (Рисунок 9). Результаты трёхмерной реконструкции раскрывают пространственные паттерны распределения, характеристики связности и гетерогенность развития трещин, предоставляя основу данных для количественного анализа пространственных структурных параметров сетей трещин.
В трёхмерном пространстве трещины демонстрируют сложное и запутанное распределение, указывая на наличие множественных продольно простирающихся трещин в исходном керне горной породы. Дополнительно существуют значительные различия в распределении различных трещин в пределах трёхмерного пространства: некоторые трещины простираются от верха до низа керна, тогда как другие ограничены только локализованными областями керна в трёх измерениях (Рисунок 9).

Рисунок 9. Результаты трёхмерной реконструкции трещин.

4. Обсуждение

4.1. Характеристика трёхмерной пространственной связности трещин

В данном исследовании количественно оцениваются характеристики связности трещин в трёхмерном пространстве с использованием алгоритма маркировки связных компонентов. Анализ связности показывает, что сеть трещин может быть разделена на четыре независимые связные области. Основная связная область составляет 79,6% от общего объёма трещин и формирует сложную трёхмерную сеть трещин, простирающуюся от верха до низа керна, устанавливая доминирующий пространственный путь потока. Наименьшая связная область составляет только 0,9% от общего объёма трещин и оказывает ограниченное влияние на общие пространственные пути потока внутри породы (Рисунок 10). Взаимосвязанная сеть трещин обеспечивает благоприятные каналы для миграции углеводородов под землёй. Дополнительно в призабойной области такая сложная и проникающая сеть трещин может существенно влиять на устойчивость ствола скважины.

Рисунок 10. Анализ связности в трёхмерном пространстве. (Слева): Связные области, (Справа): Доля связных областей.

4.2. Трёхмерная сложность трещин

Для характеристики сложности пространственного распределения трёхмерной сети трещин в данном исследовании вычислялись связность и сложность для каждой связной области трещин. Связность относится к отношению длины каркаса к максимальной длине внутри связной области — чем ниже связность, тем более сложным является распределение сети трещин. Сложность здесь в первую очередь относится к отношению между самыми дальними и самыми короткими расстояниями среди несмежных пикселей внутри связной области — чем выше сложность, тем более запутанным является распределение сети трещин. Анализ показывает, что среди четырёх связных областей область с наибольшим объёмом демонстрирует наиболее сложное распределение сети трещин, тогда как область с наименьшим объёмом показывает относительно более простое распределение (Рисунок 11). В целом, чем больше объём связной области, тем более сложным является её пространственное распределение в трёх измерениях. Сложность наибольшей связной области достигает 87, тогда как сложность двух меньших связных областей составляет только 18 и 7 соответственно.

Рисунок 11. Трёхмерный анализ сложности трещин.

5. Выводы

В данном исследовании улучшена пороговая сегментация для установления метода сегментации трещин SRTG, который точно сегментирует и извлекает трещины из КТ-сканированных изображений, реконструирует трещины в трёхмерном пространстве и анализирует распределение сетей трещин в трёх измерениях. Из данного исследования делаются следующие выводы:

Путём интеграции сегментации суперпикселями SLIC и ResNet50 для улучшения пороговой сегментации точность сегментации трещин может быть повышена, снижая помехи от шумовых пикселей в изображении на области трещин. Более того, локально сложные области трещины становятся более выраженными после сегментации.
Кластеризация гауссовой смеси может точно кластеризовать шум, фон и трещины в изображениях, сегментированных методом SRT. На основе результатов кластеризации удаление шума дополнительно снижает шум изображения, закладывая основу для точной трёхмерной реконструкции трещин.
По сравнению с пороговой сегментацией значение шума морфологического анализа в двумерных изображениях, сегментированных методом, предложенным в данном исследовании, снизилось с 0,21% до 0,08%.
После трёхмерной реконструкции трещины демонстрируют сложное распределение в трёхмерном пространстве. Сеть трещин может быть разделена на несколько независимых связных областей, каждая из которых демонстрирует отчётливые трёхмерные характеристики.
Сложность и связность сетей трещин различаются в трёхмерном пространстве. Как правило, более крупные сети трещин имеют тенденцию демонстрировать более высокую сложность. Трёхмерная сложность сети трещин наибольшей связной области составляет 57, тогда как наименьшей связной области — только 7.

Данное исследование в первую очередь предлагает высокоточный метод сегментации, извлечения и трёхмерной реконструкции трещин. Этот метод может использоваться для количественной характеристики трещин горных пород во время анализа устойчивости ствола скважины и процессов гидроразрыва. В будущих исследованиях на основе данного исследования будут проводиться анализы трещин в связи с минеральными и формационными свойствами и структурами.

Первоисточник: https://www.mdpi.com/2076-3417/16/5/2533
Авторы:
Сиуся Сунь1, Юндун Фань2,*, Янь Цзинь1,*, Юньху Лу1, Ботао Линь3, Сяо Чжан4
1 Колледж нефтегазового инжиниринга, Китайский университет нефтегазовой промышленности, Пекин 102249, Китай
2 Колледж нефтегазового инжиниринга, Сианьский университет нефтегазовой промышленности, Сиань 710065, Китай
3 Колледж искусственного интеллекта, Китайский университет нефтегазовой промышленности, Пекин 102249, Китай
4 Колледж естественных наук, Китайский университет нефтегазовой промышленности, Пекин 102249, Китай

Список литературы

01. Lei, J.; Fan, Y.F. Rock CT Image Fracture Segmentation Based on Convolutional Neural Networks. Rock Mech. Rock Eng. 2024, 57, 5883–5898. [Google Scholar] [CrossRef]
02. Mahmoudi, S.; Asghari, O.; Boisvert, J. Addressing Class Imbalance in Micro-CT Image Segmentation: A Modified U-Net Model with Pixel-Level Class Weighting. Comput. Geosci. 2025, 196, 105853. [Google Scholar] [CrossRef]
03. Golsanami, N.; Guo, D.; Fernando, S.G.; Kumral, M.; Jiang, L.; Raveendrasinghe, T.; Saberali, B.; Saedi, G.; Yan, W.; Bakhshi, E.; et al. Tensile Fracture Propagation in Deep Coalbed Methane Layers Under Brazilian Test: A Quantitative Analysis Using Digital Rock Technology and Deep Learning Based Image Segmentation. Rock Mech. Rock Eng. 2025, 58, 10613–10641. [Google Scholar] [CrossRef]
04. Martirosyan, A.; Ilyushin, Y.; Afanaseva, O.; Kukharova, T.; Asadulagi, M.; Khloponina, V. Development of an Oil Field's Conceptual Model. Int. J. Eng. 2025, 38, 381–388. [Google Scholar] [CrossRef]
05. He, C.; Sadeghpour, H.; Shi, Y.; Mishra, B.; Roshankhah, S. Mapping Distribution of Fractures and Minerals in Rock Samples using Res-VGG-UNet and Threshold Segmentation Methods. Comput. Geosci. 2024, 175, 106675. [Google Scholar] [CrossRef]
06. Kou, B.; Yang, X.; Zhang, Z.; Li, Z. Exploring the Influence of Different Cooling Methods on the Pore Structure of Gneiss using MCT-Threshold Segmentation Method. J. Appl. Geophys. 2025, 243, 105947. [Google Scholar] [CrossRef]
07. Wang, Z.; Hou, Z.; Cao, D. Deep-learning-based Digital Rock Physics analysis: From Image Segmentation and Edge Detection by few-shot Learning to Mechanical Properties prediction. Geoenergy Sci. Eng. 2026, 256, 214133. [Google Scholar] [CrossRef]
08. Xu, S.; Jiang, W.; Liu, Q.; Wang, H.; Zhang, J.; Li, J.; Huang, X.; Bo, Y. Coal-rock Interface Real-time Recognition based on the Improved YOLO Detection and Bilateral Segmentation Network. Undergr. Space 2025, 21, 22–43. [Google Scholar] [CrossRef]
09. Wang, H.; Yang, X.; Zhou, C.; Yan, J.; Yu, J.; Xie, K. Constructions of Multi-scale 3D Digital Rocks by Associated Image Segmentation Method. Front. Earth Sci. 2025, 12, 1518561. [Google Scholar] [CrossRef]
10. Zou, Y.; Yao, G.; Wang, J. Research on 3D Crack Segmentation of CT Images of Oil Rock Core. PLoS ONE 2021, 16, e0258463. [Google Scholar] [CrossRef] [PubMed]
11. Jones, D.D.; Feng, Y.T. Effect of Image Scaling and Segmentation in Digital Rock Characterisation. Comput. Part. Mech. 2016, 3, 201–213. [Google Scholar] [CrossRef]
12. Wang, F.Y.; Zai, Y. Image Segmentation and Flow Prediction of Digital Rock with U-net Network. Adv. Water Resour. 2023, 172, 104384. [Google Scholar] [CrossRef]
13. Hayatdavoudi, M.; Niri, M.E.; Kalhor, A. Comparative Analysis of Sandstone Microtomographic Image Segmentation using Advanced Convolutional Neural Networks with Pixelwise and Physical Accuracy Evaluation. Sci. Rep. 2025, 15, 22164. [Google Scholar] [CrossRef]
14. Li, B.; Nie, X.; Cai, J.; Zhou, X.; Wang, C.; Han, D. U-Net Model for Multi-Component Digital Rock Modeling of Shales based on CT and QEMSCAN Images. J. Pet. Sci. Eng. 2022, 216, 110734. [Google Scholar]
15. Karimpouli, S.; Kadyrov, R.; Siegert, M.; Saenger, E.H. Applicability of 2D Algorithms for 3D Characterization in Digital Rocks Physics: An Example of a Machine Learning-based Super Resolution Image Generation. Acta Geophys. 2024, 72, 861–874. [Google Scholar] [CrossRef]
16. Liang, J.; Sun, Y.; Lebedev, M.; Gurevich, B.; Nzikou, M.; Vialle, S.; Glubokovskikh, S. Multi-mineral Segmentation of Micro-tomographic Images Using a Convolutional Neural Network. Comput. Geosci. 2022, 168, 105217. [Google Scholar] [CrossRef]
17. Saxena, N.; Day-Stirrat, R.J.; Hows, A.; Hofmann, R. Application of Deep Learning for Semantic Segmentation of Sandstone Thin Sections. Comput. Geosci. 2021, 152, 104778. [Google Scholar] [CrossRef]
18. Zhao, Z.; Zhou, X.P. 3D Digital Analysis of Cracking Behaviors of Rocks through 3D Reconstruction Model under Triaxial Compression. J. Eng. Mech. 2020, 146, 04020084. [Google Scholar] [CrossRef]
19. Luo, X.; Sun, J.; Zhang, R.; Chi, P.; Cui, R. A Multi-condition Denoising Diffusion Probabilistic Model Controls the Reconstruction of 3D Digital Rocks. Comput. Geosci. 2024, 184, 105541. [Google Scholar] [CrossRef]
20. Hou, S.; Hou, Z.Y.; Cao, D.P. 3D Digital Core Reconstruction from Limited Core-scanned Images: An Improved Diffusion Model with Multi-modal Information Fusion. Geoenergy Sci. Eng. 2026, 258, 214309. [Google Scholar]
21. Lang, Y.; Liang, Z.; Dong, Z. Three-Dimensional Finite Element Simulation and Reconstruction of Jointed Rock Models Using CT Scanning and Photogrammetry. J. Rock Mech. Geotech. Eng. 2024, 16, 1348–1361. [Google Scholar]
22. Zhao, Z.; Zhou, X.P. Digital Measurement of 2D and 3D Cracks in Sandstones through Improved Pseudo Color Image Enhancement and 3D Reconstruction Method. Int. J. Numer. Anal. Methods Geomech. 2019, 43, 2565–2584. [Google Scholar]
23. You, N.; Li, Y.E.; Cheng, A. 3D Carbonate Digital Rock Reconstruction Using Progressive Growing GAN. J. Geophys. Res.-Solid Earth 2021, 126, e2021JB021687. [Google Scholar]
24. Li, J.; Teng, Q.; Zhang, N.; Chen, H.; He, X. Deep Learning Method of Stochastic Reconstruction of Three-Dimensional Digital Cores from a Two-Dimensional Image. Phys. Rev. E 2023, 107, 055309. [Google Scholar]
25. Liang, Y.; Wang, S.; Feng, Q.; Zhang, M.; Cao, X.; Wang, X. Ultrahigh-Resolution Reconstruction of Shale Digital Rocks from FIB-SEM Images Using Deep Learning. SPE J. 2024, 29, 1434–1450. [Google Scholar]
26. Chi, P.; Sun, J.; Luo, X.; Cui, R.; Dong, H. Reconstruction of 3D Digital Rocks with Controllable Porosity Using CVAE-GAN. Geoenergy Sci. Eng. 2023, 230, 212264. [Google Scholar] [CrossRef]
27. You, S.; Liao, Q.; Yan, Z.; Li, G.; Tian, S.; Song, X.; Wang, H.; Xue, L.; Lei, G.; Liu, X.; et al. Super-Resolution Reconstruction of 3D Digital Rocks by Deep Neural Networks. Geoenergy Sci. Eng. 2024, 237, 212781. [Google Scholar] [CrossRef]
28. Tinet, A.-J.; Corlay, Q.; Collon, P.; Golfier, F.; Kalo, K. Comparison of Various 3D Pore Space Reconstruction Methods and Implications on Transport Properties of Nanoporous Rocks. Adv. Water Resour. 2020, 141, 103615. [Google Scholar] [CrossRef]
29. Zheng, Q.; Zhang, D.X. RockGPT: Reconstructing Three-Dimensional Digital Rocks from Single Two-Dimensional Slice with Deep Learning. Comput. Geosci. 2022, 26, 677–696. [Google Scholar] [CrossRef]
30. Liu, H.; Liu, Y.; Zhou, M.; Liu, L.; Liu, J.; Liu, Z.; Li, H.; Li, P. Research on 3D Modeling Method of Tunnel Surrounding Rock Structural Planes Based on B-Spline Interpolation. Appl. Sci. 2025, 15, 8142. [Google Scholar] [CrossRef]
31. Li, H.; Ni, H.; Fu, J.; Wan, B.; Chu, D.; Fang, F.; Wang, R.; Ma, G.; Zhou, X. A Domain-decomposition-based Parallel Approach for 3D Geological Modeling Using Radial basis Functions Interpolation on GPUs. Earth Sci. Inform. 2025, 18, 37. [Google Scholar] [CrossRef]
32. Liu, L.; Yao, J.; Imani, G.; Sun, H.; Zhang, L.; Yang, Y.; Zhang, K. Reconstruction of 3D multi-mineral shale digital rock from a 2D image based on multi-point statistics. Front. Earth Sci. 2023, 10, 1104401. [Google Scholar] [CrossRef]
33. Fan, Y.; Pang, H.; Jin, Y.; Meng, H.; Lu, Y.; Wei, S.; Wang, H. Integration of image recognition and expert system for real-time wellbore stability analysis. Adv. Geo-Energy Res. 2025, 15, 158–171. [Google Scholar] [CrossRef]

СУБР

Цветанский Артур Сергеевич