Всем добрый день. Представляю вашему вниманию метод обработки первичных данных для последующего практического применения методов машинного обучения (ML) с целью индикации вероятной локализации оруденения.

История уходит в недалекий 2018 год, когда с развитием цифровых технологий зародилась идея о том, что нужна не просто «указка», где искать, а некий вероятностный индикатор, чтобы он как бы подсвечивал вероятные участки оруденения. В данной статье представлен разбор двух успешных кейсов, как следствие применения данной разработки.

Сначала о самом методе. Метод довольно прост в исполнении. В геологии в открытом доступе имеется множество карт разной информативной наполненности (см. источники).

В основу получения данных легли растровые изображения геологических карт. Это может быть склейка из нескольких карт, фотография, скан. Главное — парсинг итогового изображения в слои данных «маскировки». Маскировка является закрашенным контуром какого-либо признака. Это могут быть магнитные аномалии, линии разломов, массивы кислых или основных горных пород, дифференциация пород по временным характеристикам и так далее, которые именуем признаками.

Следующим этапом является обработка «замаскированных» слоев признаков — создание матриц ближайших расстояний от каждой. Ключевой момент в обработке данных — применение формулы подсчета ближайшего расстояния от точки поля до точки признака.

Принцип алгоритмической обработки растровых изображений в данном методе
Принцип алгоритмической обработки растровых изображений в данном методе

Подготавливаемые изображения должны быть соотнесены друг с другом, затем их частично высвечивают, чтобы исключить появление последующих артефактов. В качестве маски используется цвет черный (0, 0, 0). Дальнейшее приведение использования методов машинного обучения опускаются, поскольку речь идет главным образом о самом подходе к подготовке данных.

Как обработка данных выглядит на примере одного обработанного слоя признака:

Исходный растр данных (геологическая карта)
Исходный растр данных (геологическая карта)
Маскировка (слева) и результат преобразования маски признака в карту расстояний (справа)
Маскировка (слева) и результат преобразования маски признака в карту расстояний (справа)

Карты расстояний в совокупности являются в геологии аналогом сильно усредненных ореолов распространения энергии и вещества.

Простая реализация алгоритма подготовки данных
import warnings
warnings.filterwarnings('ignore')

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

from PIL import Image
# загрузка изображения геологической карты с маской одного признака
img = np.asarray(Image.open('Figure.png').convert('RGB'))
# приведение всего растра слоя к таблице датафрейма
result = pd.DataFrame({'x': [], 'y': [], 'l': []})

for y in np.arange(len(img)):
    
    for x in np.arange(len(img[y])):
        
        if sum(img[y][x]) == 0:
            result.loc[result.shape[0]] = [x, y, 1]
        else:
            result.loc[result.shape[0]] = [x, y, 0]
# разделяем маску от поля точек
zeros_data = result[result['l'] == 0]
ones_data = result[result['l'] == 1]
# разные варианты представлены для демонстрации модификаций использования расстояний
variant = 1

# главный алгоритм
for i1, (x1, y1, l1) in zip(zeros_data.index, zeros_data.values):
    
    if zeros_data.loc[i1, 'l'] != 0: continue
    
    # пул всех расстояний до точки
    pool_distance = []
    
    for i2, (x2, y2, l2) in zip(ones_data.index, ones_data.values):
        
        pool_distance.append(
        ((x1 - x2) * (x1 - x2) + (y1 - y2) * (y1 - y2))**.5
        )
    
    # простое правило - ближайшее расстояние до точки
    if variant == 1:
        zeros_data.loc[i1, 'l'] = np.min(pool_distance)

    # предпоследнее или другое значение - 
    # как способ защиты от одиночных случайных точек
    elif variant == 2:
        zeros_data.loc[i1, 'l'] = np.sort(pool_distance)[1]

    # среднее по нескольким близким расстояниям - возможность сглаживания
    elif variant == 3:
        zeros_data.loc[i1, 'l'] = np.mean(np.sort(pool_distance)[1:101])
# сводим в готовый слой данных для ML
result_data = pd.concat([zeros_data, ones_data]).sort_index()
# сохраняем новый слой данных
result_data.to_csv('new_fuature', index=False)

Ниже представлены практические результаты применения данного метода в формате презентаций

Кейс № 1. Региональные поиски золотого оруденения в Свердловской области.
Слайд 1. Обзорная карта
Слайд 1. Обзорная карта

В качестве исходных данных были использованы две склеенные геологические карты, схема расположения которых по номенклатуре листов — P-40-XXX и P-40-XXXVI, также прилагаемые карты магнитных аномалий, тектонические карты и карта локализации известных рудопроявлений золота. Данные были преобразованы в карты расстояний описанным выше способом с использованием дополнительных фильтров (к примеру, логарифмирование). Разметка данных обучения содержала четыре класса данных: промышленные месторождения, рудопроявления, пункты минерализации и «пустота». Данные были разделены на тренировочные и тестовые выборки.

Слайд 2. Преобразование данных
Слайд 2. Преобразование данных

В результате была получена «золото‑вероятностная» тепловая карта, позволяющая обратить внимание на отдельные ее области.

Слайд 3. Результаты прогнозирования натренированной модели.
Слайд 3. Результаты прогнозирования натренированной модели.

Здесь на слайде 3, выделен один из перспективных объектов — потенциальное оруденение в районе р. Вижай. Также здесь приводятся данные, поднятые с отчетов предшественников в сравнении с прогнозом обученной модели по картам расстояний.

кстати...

Название реки «Вижай» с санскрита переводится как Победа — Виджай

Слайд 4. Таблица данных предшественников о районе.
Слайд 4. Таблица данных предшественников о районе.

Давайте рассчитаем ресурсный потенциал по золоту Вижайского рудного поля. По данным предшественников, в районе выделено несколько потенциальных рудных зон, перспективных на золотометальное оруденение. Рудоносная формация — терригенная черносланцевая, рудная формация черносланцевая золоторудная, геолого‑промышленный тип руд — золото‑сульфидно-кварцевый.

Слайд 5. Наглядное представление о геологической изученности района.
Слайд 5. Наглядное представление о геологической изученности района.

Слайд 6. Сравнение объектов-эталонов
Слайд 6. Сравнение объектов-эталонов

Сурьинский рудный узел и Оленевское рудное поле едва ли имеют одинаковую золотоносную продуктивность, так как обстановки разные и, соответственно, геолого-промышленные типы тоже разные. Рудовмещающие пачки сланцев Сурьинского рудного узла формировались в позднем рифее в нестабильной прибрежной обстановке, тогда как рудовмещение Оленевского рудного поля имеет девонский возраст, условия формирования — коллизия.

Сурьинский рудный узел расположен в пределах Ишемирской минерагенической зоны, в то время как Вижайское и Оленевское рудные поля расположены в пределах Западно-Тагильской минерагенической зоны.

В геологическом строении толщ Оленевского и Вижайского рудных полей принимает участие Войкаро-Кемпирсайский тектоногенный комплекс. По этим причинам и другим причинам Автором настоящего проекта был пересчитан металлоносный потенциал рудных зон Вижайского рудного поля, который составил порядка 130 т. Глубина оценки: 150 метров.

Слайд 7. Сходство обоих рудных объектов
Слайд 7. Сходство обоих рудных объектов

Выдвинем аналогичное предположение:
площадь Оленевского рудного поля: 6,5 км. * 0,4 км. = 2,6 кв.км.
удельная продуктивность Оленевского рудного поля: 51 т. /2,6 кв.км. = 16,7 т/кв.км., где
ресурсы категории P3 — 51 т.;
16,7 — Удель ная продуктивность рудной зоны эталонного объекта;

Итого предполагаемые ресурсы с учетом продуктивности эталонного объекта составили: 26 кв.км. * 16,7 т/кв.км. * 0,3 = 130 т.,
где
26 — суммарная площадь двух потенциальных золоторудных зон Вижайского рудного поля, выделенных автором (см. приложение 6);
0,3 — коэффициент достоверности прогноза;

В результате предполагаемый ресурсный потенциал Вижайского рудного поля— 130 тонн Au металла, подсчитанный методом аналогии.

Кейс № 2. Региональные поиски медного оруденения в Красноярском крае.

Территориально объект расположен на юге Красноярского края, в 100 км от областного центра

Слайд 1. Обзорная карта расположения объекта
Слайд 1. Обзорная карта расположения объекта

В данном кейсе рассмотрим Тасеевский потенциальный медно-рудный узел. С помощью машинного обучения исследуем весь медно-рудный узел, который является на сегодняшний день слабоизученным.

В строении Таеевского узла принимают участие осадочные породы так называемой Тасеевской серии. Синклинорий сложен измененными отложениями верхнего протерозоя и прорванными интрузивными образованиями Синийского и Токминского комплексов. Основные усилия предшественников были сосредоточены на южную часть узла. Так по результатам поисков была выделена Ологашская площадь. В пределах площади было выявлено множество геохимических аномалий по халькофильным элементам и ряд пунктов медной минерализации и рудопроявлений. Предшественники отметили более 300 геохимических ореолов меди размерами до полукилометра с максимальными содержаниями 0,1%. Присутствие урана в породах тасеевской серии добавило гриф секретности проводимым поисковым работам, который позже был снят.

Слайд 2. Геологическая обстановка Антоновская и Ологашская площади
Слайд 2. Геологическая обстановка Антоновская и Ологашская площади

Ресурсный потенциал Ологашской площади по разным оценкам составляет порядка от 8 — 20 млн. тонн Cu металла.

Слайд 3. Меденосный потенциал Ологашской площади
Слайд 3. Меденосный потенциал Ологашской площади

Как стало известно, предшественниками была оставлена без внимания вся средняя и северная часть Тасеевского узла. В целях выявления дополнительных перспективных площадей использовался метод компьютерного моделирования — машинное обучение.

В качестве признаков обучения использовались карты расстояний до разломов, расстояния до зон халькофильных аномалий и расстояния до ближайших выходов магматических пород. В качестве целевой переменной использовались данные о геохимических аномалиях, пунктах минерализации и рудопроявлениях меди. Здесь я привожу результаты анализа всему Тасеевскому узлу.

Слайд 4. Маскировка признаков и конвертация слоев признаков в карты расстояний
Слайд 4. Маскировка признаков и конвертация слоев признаков в карты расстояний
Слайд 5. Результаты прогнозирования обученной модели. Желтый контур - границы Центральной площади
Слайд 5. Результаты прогнозирования обученной модели. Желтый контур — границы Центральной площади

Таким образом была выявлена перспективная Центральная площадь, которая находится в контуре антоновской площади. К счастью, в границах антоновской площади предшественники-уранщики пробурили скважины прямо по западному флангу Тасеевской серии, таким образом вскрыв полный разрез Тасеевских отложений. Так удалось оценить меденосный потенциал на данной площади, взяв бортовое содержание 0,35%. Таким образом, предполагается ресурсный потенциал на Антоновской площади в 1,6 миллиона тонн меди.

Слайд 6. Центральная площадь. Результаты подсчетов ресурсного потенциала по Антоновской площади
Слайд 6. Центральная площадь. Результаты подсчетов ресурсного потенциала по Антоновской площади

Хотелось бы отметить, что по результатам работ на Антоновской площади электроразведка методом переходных процессов здесь хорошо сработала. В аномалиях выявляется медное оруденение, и этому есть подтверждения. Так, при заверке выявленных геофизических аномалий скважинами 2112, 2120 и 2140 были вскрыты горизонты медного оруденения. Согласно рекомендациям машинного обучения, я выделил Центральную площадь размером в 120 квадратных километров, в пределах которой также выделяются рудопроявления меди и возможны геофизические аномалии.

Слайд 7. Разрезы по скважинам с содержанием халькофильных элементов. Зеленый - медь.
Слайд 7. Разрезы по скважинам с содержанием халькофильных элементов. Зеленый — медь.

По итогу прогнозируется в пределах Центральной площади 6,9 миллионов тонн меди со средним содержанием в 1,69%

Слайд 8. Подсчет прогноза ресурсного потенциала Центральной площади
Слайд 8. Подсчет прогноза ресурсного потенциала Центральной площади

Резюме
С помощью данного подхода к обработке растровых данных удалось получить интересный вероятностный индикатор для уменьшения области поисков минеральных ресурсов.

Результатом практического применения данного индикатора прирост ресурсного потенциала минерально-сырьевой базы сообщества Хабр составил:
+ 130 тонн золота
+ 6,9 млн. тонн меди

Источники

интернет ресурсы растровых геоданных
Государственные геологические карты России
Карта прогнозных ресурсов категории Р3

кейс № 1
1.Петров Г.А, Ильясова Г.А., Останин С.Ю., Тристан Н.И., Е.Н.Михалёва и др. Геологический отчет по объекту “ГДП-200 в пределах Северо-Уральской площади (лист Р-40-XXXVI)” за 2003-2006 гг.

2.Зубков А.И, Прогнозно-поисковые работы на благородные металлы (золото, платина) на площади листов P-40-XXX, P-40-XXXVI (Средний и Северный Урал)» за 2001-2004гг. Екатеринбург, 2004 г.

3.Петров Г.А, Ильясова Г.А., Останин С.Ю., Е.Н.Михалёва и др. Отчет о результатах работ по объекту “ГДП-200 листа Р-40-XXX (Тохтинская площадь)”, 2014г.

кейс № 2
1.Моргун В.Н, Отчет Букарской партии Ивановской экспедиции о поисках меди в междуречье рек Верхний и Малый Курыш в 1960-61 гг. (м-б 1:50000, листы 0-46-XXXV, XXXVI)

2.Домаренко В.А, Оценка перспектив ураноносности зоны структурно-стратиграфического несогласия Восточной части Ангаро-Канского выступа Енисейского кряжа. Отчет Саянской экспедиции № 53 о результатах прогнозно-поисковых работ м-ба 1:200000-1:50000 и крупнее по геолог.заданию 53-15 за 1986-1990 гг.

3.Семеняко В.В, Результаты геохимических поисков масштаба 1:50000 в Ангаро-Канской части Енисейского кряжа на Немкинской площади. Отчет Богунайской партии о результатах геохимических поисков масштаба 1:50000, проведенных в 1989 - 1991годах на Немкинской площади.

4.Заблоцкий К.А, Информационный отчет по производству ГГС масштаба 1:50 000 с общими поисками на площади листов О-46-129-Б; 130-А,Б,В,Г (Немкинская площадь) за 1991-1994 гг.

5.Зуев В.К, Создание комплектов Государственной геологической карты масштаба 1:1000000. ФГУГП «Красноярскгеолсъёмка» , ФГУП «ВСЕГЕИ». 2005 г.

6.Зуев В.К, Государственная геологическая карта Российской Федерации. Масштаб 1 : 1 000 000 (третье поколение). Серия Ангаро-Енисейская. Лист O-46 – Красноярск. Объяснительная записка

Комментарии (5)


  1. Zara6502
    27.07.2023 09:05
    +1

    Жаль материал не в формате научпопа - ничего не понятно, особенно связь между картинками карт и рудой.


    1. DjMpegAlex Автор
      27.07.2023 09:05

      Спасибо за комментарий. Конечно, в поисковой геологии для оценки количества вероятного оруденения используется метод аналогии. При этом используются известные поисковые признаки, по аналогии с "эталонным объектом". Здесь же рассматривается именно применение дополнительного слоя данных - карт расстояний, как индикация области поисков (то есть взаимопересечение расстояний от локализации признаков - вулканические, тектонические, геологическое, геохимические, геофизических - является похожей с эталонными размеченными данными). Вы правы, но в научно-популярном виде представить данную статью не представляется возможным, к сожалению, по причине громоздкости материала. Возможно в виде анимаций какую-то информацию представлять получится в следующих статьях для наглядности. Спасибо еще раз.


      1. Zara6502
        27.07.2023 09:05

        Таааак, то есть вы пользуетесь не картами со спутника которые картинки, а геологическими картами где уже размечена руда? Я правильно понял?


        1. DjMpegAlex Автор
          27.07.2023 09:05

          Дело в том что геологические карты отражают возраст пород, скрытые часто под четвертичными отложениями. Четвертичные отложения толщиной могут достигать более десятков метров. Но геологические карты также применяются для выделения в них масок признаков - не только структурных особенностей (синклинали, взбросы, прорвы интрузий, разрывные нарушения и т.д.). То есть тупо беру интересующую геологическую карту с сайтов который указал в источниках. Затем есть там же карты полезных ископаемых - на эти карты нанесены известные уже месторождения, рудопроявления, пункты минерализации на карту. Но для того, чтобы детальнее разметить данные целевой переменной обучения, нужно поднимать геологические отчеты. Лично я ездил в Росгеолфонд в Москву. Там по предварительной записи нужно заказывать отчеты. Там есть читальный зал, вот сидишь разбираешь материалы. Это долго, но можно получить очень качественный датасет.

          Руду я размечал разными цветами. Пользовался исключительно фотошопом, там удобно карты накладывать одну на другую. Часть карты могут быть отрисованы в разных координатных системах, это тоже в фотошопе проще всего подгонять. "Рудный градиент" - месторождения, скажем это класс 3, класс 2 это рудопроявления, класс 1 это пункты минерализации и пусто это 0.

          Таким образом нами находилась руда на медь даже под озерами и реками. То есть со спутника это выглядет как водная гладь, или заболоченная местность, но проведенные поисковые работы подтвердили, что геохимические аномалии уходят в сторону озера. Например, аэрогеофизика и космогеофизика имеет здесь свои недостатки, вода является хорошим отражателем, а углифицированные породы сильным поглотителем - это болотистые места.


          1. Zara6502
            27.07.2023 09:05

            Понял, спасибо за ответ, этого и не хватало для понимания.