Всем добрый день. Представляю вашему вниманию метод обработки первичных данных для последующего практического применения методов машинного обучения (ML) с целью индикации вероятной локализации оруденения.
История уходит в недалекий 2018 год, когда с развитием цифровых технологий зародилась идея о том, что нужна не просто «указка», где искать, а некий вероятностный индикатор, чтобы он как бы подсвечивал вероятные участки оруденения. В данной статье представлен разбор двух успешных кейсов, как следствие применения данной разработки.
Сначала о самом методе. Метод довольно прост в исполнении. В геологии в открытом доступе имеется множество карт разной информативной наполненности (см. источники).
В основу получения данных легли растровые изображения геологических карт. Это может быть склейка из нескольких карт, фотография, скан. Главное — парсинг итогового изображения в слои данных «маскировки». Маскировка является закрашенным контуром какого-либо признака. Это могут быть магнитные аномалии, линии разломов, массивы кислых или основных горных пород, дифференциация пород по временным характеристикам и так далее, которые именуем признаками.
Следующим этапом является обработка «замаскированных» слоев признаков — создание матриц ближайших расстояний от каждой. Ключевой момент в обработке данных — применение формулы подсчета ближайшего расстояния от точки поля до точки признака.
Подготавливаемые изображения должны быть соотнесены друг с другом, затем их частично высвечивают, чтобы исключить появление последующих артефактов. В качестве маски используется цвет черный (0, 0, 0). Дальнейшее приведение использования методов машинного обучения опускаются, поскольку речь идет главным образом о самом подходе к подготовке данных.
Как обработка данных выглядит на примере одного обработанного слоя признака:
Карты расстояний в совокупности являются в геологии аналогом сильно усредненных ореолов распространения энергии и вещества.
Простая реализация алгоритма подготовки данных
import warnings
warnings.filterwarnings('ignore')
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from PIL import Image
# загрузка изображения геологической карты с маской одного признака
img = np.asarray(Image.open('Figure.png').convert('RGB'))
# приведение всего растра слоя к таблице датафрейма
result = pd.DataFrame({'x': [], 'y': [], 'l': []})
for y in np.arange(len(img)):
for x in np.arange(len(img[y])):
if sum(img[y][x]) == 0:
result.loc[result.shape[0]] = [x, y, 1]
else:
result.loc[result.shape[0]] = [x, y, 0]
# разделяем маску от поля точек
zeros_data = result[result['l'] == 0]
ones_data = result[result['l'] == 1]
# разные варианты представлены для демонстрации модификаций использования расстояний
variant = 1
# главный алгоритм
for i1, (x1, y1, l1) in zip(zeros_data.index, zeros_data.values):
if zeros_data.loc[i1, 'l'] != 0: continue
# пул всех расстояний до точки
pool_distance = []
for i2, (x2, y2, l2) in zip(ones_data.index, ones_data.values):
pool_distance.append(
((x1 - x2) * (x1 - x2) + (y1 - y2) * (y1 - y2))**.5
)
# простое правило - ближайшее расстояние до точки
if variant == 1:
zeros_data.loc[i1, 'l'] = np.min(pool_distance)
# предпоследнее или другое значение -
# как способ защиты от одиночных случайных точек
elif variant == 2:
zeros_data.loc[i1, 'l'] = np.sort(pool_distance)[1]
# среднее по нескольким близким расстояниям - возможность сглаживания
elif variant == 3:
zeros_data.loc[i1, 'l'] = np.mean(np.sort(pool_distance)[1:101])
# сводим в готовый слой данных для ML
result_data = pd.concat([zeros_data, ones_data]).sort_index()
# сохраняем новый слой данных
result_data.to_csv('new_fuature', index=False)
Ниже представлены практические результаты применения данного метода в формате презентаций
Кейс № 1. Региональные поиски золотого оруденения в Свердловской области.
В качестве исходных данных были использованы две склеенные геологические карты, схема расположения которых по номенклатуре листов — P-40-XXX и P-40-XXXVI, также прилагаемые карты магнитных аномалий, тектонические карты и карта локализации известных рудопроявлений золота. Данные были преобразованы в карты расстояний описанным выше способом с использованием дополнительных фильтров (к примеру, логарифмирование). Разметка данных обучения содержала четыре класса данных: промышленные месторождения, рудопроявления, пункты минерализации и «пустота». Данные были разделены на тренировочные и тестовые выборки.
В результате была получена «золото‑вероятностная» тепловая карта, позволяющая обратить внимание на отдельные ее области.
Здесь на слайде 3, выделен один из перспективных объектов — потенциальное оруденение в районе р. Вижай. Также здесь приводятся данные, поднятые с отчетов предшественников в сравнении с прогнозом обученной модели по картам расстояний.
кстати...
Название реки «Вижай» с санскрита переводится как Победа — Виджай
Давайте рассчитаем ресурсный потенциал по золоту Вижайского рудного поля. По данным предшественников, в районе выделено несколько потенциальных рудных зон, перспективных на золотометальное оруденение. Рудоносная формация — терригенная черносланцевая, рудная формация черносланцевая золоторудная, геолого‑промышленный тип руд — золото‑сульфидно-кварцевый.
Сурьинский рудный узел и Оленевское рудное поле едва ли имеют одинаковую золотоносную продуктивность, так как обстановки разные и, соответственно, геолого-промышленные типы тоже разные. Рудовмещающие пачки сланцев Сурьинского рудного узла формировались в позднем рифее в нестабильной прибрежной обстановке, тогда как рудовмещение Оленевского рудного поля имеет девонский возраст, условия формирования — коллизия.
Сурьинский рудный узел расположен в пределах Ишемирской минерагенической зоны, в то время как Вижайское и Оленевское рудные поля расположены в пределах Западно-Тагильской минерагенической зоны.
В геологическом строении толщ Оленевского и Вижайского рудных полей принимает участие Войкаро-Кемпирсайский тектоногенный комплекс. По этим причинам и другим причинам Автором настоящего проекта был пересчитан металлоносный потенциал рудных зон Вижайского рудного поля, который составил порядка 130 т. Глубина оценки: 150 метров.
Выдвинем аналогичное предположение:
площадь Оленевского рудного поля: 6,5 км. * 0,4 км. = 2,6 кв.км.
удельная продуктивность Оленевского рудного поля: 51 т. /2,6 кв.км. = 16,7 т/кв.км., где
ресурсы категории P3 — 51 т.;
16,7 — Удель ная продуктивность рудной зоны эталонного объекта;
Итого предполагаемые ресурсы с учетом продуктивности эталонного объекта составили: 26 кв.км. * 16,7 т/кв.км. * 0,3 = 130 т.,
где
26 — суммарная площадь двух потенциальных золоторудных зон Вижайского рудного поля, выделенных автором (см. приложение 6);
0,3 — коэффициент достоверности прогноза;
В результате предполагаемый ресурсный потенциал Вижайского рудного поля— 130 тонн Au металла, подсчитанный методом аналогии.
Кейс № 2. Региональные поиски медного оруденения в Красноярском крае.
Территориально объект расположен на юге Красноярского края, в 100 км от областного центра
В данном кейсе рассмотрим Тасеевский потенциальный медно-рудный узел. С помощью машинного обучения исследуем весь медно-рудный узел, который является на сегодняшний день слабоизученным.
В строении Таеевского узла принимают участие осадочные породы так называемой Тасеевской серии. Синклинорий сложен измененными отложениями верхнего протерозоя и прорванными интрузивными образованиями Синийского и Токминского комплексов. Основные усилия предшественников были сосредоточены на южную часть узла. Так по результатам поисков была выделена Ологашская площадь. В пределах площади было выявлено множество геохимических аномалий по халькофильным элементам и ряд пунктов медной минерализации и рудопроявлений. Предшественники отметили более 300 геохимических ореолов меди размерами до полукилометра с максимальными содержаниями 0,1%. Присутствие урана в породах тасеевской серии добавило гриф секретности проводимым поисковым работам, который позже был снят.
Ресурсный потенциал Ологашской площади по разным оценкам составляет порядка от 8 — 20 млн. тонн Cu металла.
Как стало известно, предшественниками была оставлена без внимания вся средняя и северная часть Тасеевского узла. В целях выявления дополнительных перспективных площадей использовался метод компьютерного моделирования — машинное обучение.
В качестве признаков обучения использовались карты расстояний до разломов, расстояния до зон халькофильных аномалий и расстояния до ближайших выходов магматических пород. В качестве целевой переменной использовались данные о геохимических аномалиях, пунктах минерализации и рудопроявлениях меди. Здесь я привожу результаты анализа всему Тасеевскому узлу.
Таким образом была выявлена перспективная Центральная площадь, которая находится в контуре антоновской площади. К счастью, в границах антоновской площади предшественники-уранщики пробурили скважины прямо по западному флангу Тасеевской серии, таким образом вскрыв полный разрез Тасеевских отложений. Так удалось оценить меденосный потенциал на данной площади, взяв бортовое содержание 0,35%. Таким образом, предполагается ресурсный потенциал на Антоновской площади в 1,6 миллиона тонн меди.
Хотелось бы отметить, что по результатам работ на Антоновской площади электроразведка методом переходных процессов здесь хорошо сработала. В аномалиях выявляется медное оруденение, и этому есть подтверждения. Так, при заверке выявленных геофизических аномалий скважинами 2112, 2120 и 2140 были вскрыты горизонты медного оруденения. Согласно рекомендациям машинного обучения, я выделил Центральную площадь размером в 120 квадратных километров, в пределах которой также выделяются рудопроявления меди и возможны геофизические аномалии.
По итогу прогнозируется в пределах Центральной площади 6,9 миллионов тонн меди со средним содержанием в 1,69%
Резюме
С помощью данного подхода к обработке растровых данных удалось получить интересный вероятностный индикатор для уменьшения области поисков минеральных ресурсов.
Результатом практического применения данного индикатора прирост ресурсного потенциала минерально-сырьевой базы сообщества Хабр составил:
+ 130 тонн золота
+ 6,9 млн. тонн меди
Источники
интернет ресурсы растровых геоданных
Государственные геологические карты России
Карта прогнозных ресурсов категории Р3
кейс № 1
1.Петров Г.А, Ильясова Г.А., Останин С.Ю., Тристан Н.И., Е.Н.Михалёва и др. Геологический отчет по объекту “ГДП-200 в пределах Северо-Уральской площади (лист Р-40-XXXVI)” за 2003-2006 гг.
2.Зубков А.И, Прогнозно-поисковые работы на благородные металлы (золото, платина) на площади листов P-40-XXX, P-40-XXXVI (Средний и Северный Урал)» за 2001-2004гг. Екатеринбург, 2004 г.
3.Петров Г.А, Ильясова Г.А., Останин С.Ю., Е.Н.Михалёва и др. Отчет о результатах работ по объекту “ГДП-200 листа Р-40-XXX (Тохтинская площадь)”, 2014г.
кейс № 2
1.Моргун В.Н, Отчет Букарской партии Ивановской экспедиции о поисках меди в междуречье рек Верхний и Малый Курыш в 1960-61 гг. (м-б 1:50000, листы 0-46-XXXV, XXXVI)
2.Домаренко В.А, Оценка перспектив ураноносности зоны структурно-стратиграфического несогласия Восточной части Ангаро-Канского выступа Енисейского кряжа. Отчет Саянской экспедиции № 53 о результатах прогнозно-поисковых работ м-ба 1:200000-1:50000 и крупнее по геолог.заданию 53-15 за 1986-1990 гг.
3.Семеняко В.В, Результаты геохимических поисков масштаба 1:50000 в Ангаро-Канской части Енисейского кряжа на Немкинской площади. Отчет Богунайской партии о результатах геохимических поисков масштаба 1:50000, проведенных в 1989 - 1991годах на Немкинской площади.
4.Заблоцкий К.А, Информационный отчет по производству ГГС масштаба 1:50 000 с общими поисками на площади листов О-46-129-Б; 130-А,Б,В,Г (Немкинская площадь) за 1991-1994 гг.
5.Зуев В.К, Создание комплектов Государственной геологической карты масштаба 1:1000000. ФГУГП «Красноярскгеолсъёмка» , ФГУП «ВСЕГЕИ». 2005 г.
6.Зуев В.К, Государственная геологическая карта Российской Федерации. Масштаб 1 : 1 000 000 (третье поколение). Серия Ангаро-Енисейская. Лист O-46 – Красноярск. Объяснительная записка
Zara6502
Жаль материал не в формате научпопа - ничего не понятно, особенно связь между картинками карт и рудой.
DjMpegAlex Автор
Спасибо за комментарий. Конечно, в поисковой геологии для оценки количества вероятного оруденения используется метод аналогии. При этом используются известные поисковые признаки, по аналогии с "эталонным объектом". Здесь же рассматривается именно применение дополнительного слоя данных - карт расстояний, как индикация области поисков (то есть взаимопересечение расстояний от локализации признаков - вулканические, тектонические, геологическое, геохимические, геофизических - является похожей с эталонными размеченными данными). Вы правы, но в научно-популярном виде представить данную статью не представляется возможным, к сожалению, по причине громоздкости материала. Возможно в виде анимаций какую-то информацию представлять получится в следующих статьях для наглядности. Спасибо еще раз.
Zara6502
Таааак, то есть вы пользуетесь не картами со спутника которые картинки, а геологическими картами где уже размечена руда? Я правильно понял?
DjMpegAlex Автор
Дело в том что геологические карты отражают возраст пород, скрытые часто под четвертичными отложениями. Четвертичные отложения толщиной могут достигать более десятков метров. Но геологические карты также применяются для выделения в них масок признаков - не только структурных особенностей (синклинали, взбросы, прорвы интрузий, разрывные нарушения и т.д.). То есть тупо беру интересующую геологическую карту с сайтов который указал в источниках. Затем есть там же карты полезных ископаемых - на эти карты нанесены известные уже месторождения, рудопроявления, пункты минерализации на карту. Но для того, чтобы детальнее разметить данные целевой переменной обучения, нужно поднимать геологические отчеты. Лично я ездил в Росгеолфонд в Москву. Там по предварительной записи нужно заказывать отчеты. Там есть читальный зал, вот сидишь разбираешь материалы. Это долго, но можно получить очень качественный датасет.
Руду я размечал разными цветами. Пользовался исключительно фотошопом, там удобно карты накладывать одну на другую. Часть карты могут быть отрисованы в разных координатных системах, это тоже в фотошопе проще всего подгонять. "Рудный градиент" - месторождения, скажем это класс 3, класс 2 это рудопроявления, класс 1 это пункты минерализации и пусто это 0.
Таким образом нами находилась руда на медь даже под озерами и реками. То есть со спутника это выглядет как водная гладь, или заболоченная местность, но проведенные поисковые работы подтвердили, что геохимические аномалии уходят в сторону озера. Например, аэрогеофизика и космогеофизика имеет здесь свои недостатки, вода является хорошим отражателем, а углифицированные породы сильным поглотителем - это болотистые места.
Zara6502
Понял, спасибо за ответ, этого и не хватало для понимания.