Привет! Предлагаем немного отвлечься от сложных актуальных тем и поговорить о... шампанском. Точнее, о том, как его совершенствуют с помощью Machine Learning.
Французский производитель шампанских вин Bollinger использует модель машинного обучения, чтобы предсказать годы хорошего урожая и противостоять проблемам изменения климата.
В начале 2021 года Виноделы Bollinger смогли впервые попробовать La Grande Année 2014, престижное шипучее вино, которое выдерживалось в погребах с момента его купажирования. La Grande Année производится только в те годы, когда общее качество сырья считается достаточно высоким, а перед выпуском в продажу напиток выдерживается под пробкой в течение семи лет.
В преддверии открытия урожая 2014 года сомелье и ценители сомневались, действительно ли он будет обильным. В тот год погода была переменчивой: рекордная жара в июне, за которой последовали холодные и влажные месяцы, замедлившие созревание винограда. Более того, для шампанского дома Bollinger характерна продукция пино нуар, а в 2014 явно отдавалось предпочтение шардоне.
Дениса Баннера, заместителя главного винодела (и фактически шеф-повара) Bollinger, эти вопросы не волновали. Он знал ответ ещё до того, как открыли первую бутылку. Потратив два года на изучение огромного количества данных, касающихся терруара, виноградников, климата и качества вина в течение сезонного цикла, он был убеждён, что 2014 год станет удачным.
В Шампани шеф-повара несут ответственность за создание сложных купажей, которые переходят в готовое вино, а ещё наблюдают за всем циклом производства вина, от первого ростка на виноградниках до сбора урожая, отжима, ферментации и так далее. Они хранители качества и мозги творческого процесса.
Единственные параметры, которые действительно учитываются ценителями винтажного шампанского — это аромат и вкус. По вкусовым показателям La Grande Année 2014, выпущенный на рынок по цене 659 долларов США за ящик, оказался хитом: свежий, элегантный, минеральный темперированный отход от полнотелой нормы с большим потенциалом дальнейшего старения. Один из винных критиков с сайта Vinous.com поставил ему редкую оценку 98/100, назвав «одним из лучших свежих вин, которые я когда-либо пробовал».
Но это всё было после дегустаций. А уверенность Баннера базировалась на анализе данных. Он решил отойти от традиции рассматривать созревание вина как нечто таинственное и алхимическое, и заняться наукой. Ему захотелось понять возможные последствия изменения климата для выращивания винограда и сохранения качества вина.
Банком данных, позволившим сделать это, стала винная библиотека Bollinger, уникальная коллекция, собранная из запасов, годами лежавших в дальних уголках подвалов винных домов. Десять лет назад начался проект по сбору, дегустации, оценке и восстановлению сотен покрытых пылью бутылок, которые сейчас составляют этот жидкий датасет.
Как развивался проект
Производителям нужно было знать больше о свои винах, чтобы анализировать собранную информацию, строить прогнозы урожая и влиять на качество сырья. Разговоры об изменении климата и его последствиях натолкнули Дениса Баннера на мысль изучить некоторые жаркие годы в прошлом и проанализировать урожай тех лет, чтобы понять, что произойдёт в будущем.
Сотрудничество с дата-сайентистами и математиками помогло руководителю Bollinger построить модель, объединяющую:
Исторические метеорологические данные;
Информацию о почве и состоянии растений для каждого сорта винограда;
Информацию о сроках основных сезонных событий, таких как распускание бутонов, цветение, созревание и сбор урожая;
Результаты лабораторных анализов (на уровень сахара и кислотность) виноградного сусла и самого вина.
Работе помогало наличие собственного жидкого архива, точных метеорологических данных с местных метеостанций, а также доступ к данным от Межпрофессионального комитета вин Шампани (CIVC).
Все собранные данные, размеченные по сорока с лишним параметрам, можно было сопоставить с оценкой того, что вышло в итоге. То есть теоретические выкладки о том, каким должно получиться шампанское, сравнивали с тем, что действительно получилось. Этому помогли дегустационные заметки Дениса Баннера о шампанском за последнее столетие из Винной библиотеки, фактически окончательное суждение о качестве каждого урожая.
Виноделы наблюдали за эволюцией лоз и сезоном созревания, сегментируя каждый этап, чтобы найти корреляцию между процессом выращивания и конечным качеством сырья и купажа. Они рассчитали, каким должен быть идеальный сценарий, и чем опасен отход от этих условий. Все данные заводились в компьютер, чтобы обучить ИИ прогнозировать качество урожая.
В итоге получилась модель, способная предсказать "силу" сезона, даже когда он только начинается. За счёт этого у виноделов появилась метрика, которую можно использовать в планировании. И она очень хорошо дополняет медленную, интуитивную оценку купажа в течение нескольких месяцев дегустаций.
Да-да, несколько месяцев. В обычных условиях после первой ферментации необходимо дегустировать около 4000 бочек, прежде чем появится чёткое представление о качестве винтажа. Да, кое-какие мысли у виноделов могут появиться во время сбора урожая, но окончательный вердикт возможен только после дегустации.
ИИ-модель Bollinger пока что не может заменить традиционный, глубокий процесс дегустации. Зато способна упростить принятие ключевых решений виноделами: объявить ли год урожая; стоит ли делать ограниченную серию; какие купажи будут; и, что особенно важно, насколько хорошо стареет винтаж.
В качестве доказательства эффективности своей математической модели руководитель Bollinger приводил лето 2021 года. Виноделы восприняли его, как катастрофу, а он утверждал, что плохая погода не сильно скажется на качестве вин. Опытная дегустация подтвердила, что все вина получились выше среднего уровня.
От теории к практике
Оценить результат — это одно. Следующим важным шагом является применение накопленных знаний и теоретических выкладок к управлению самими виноградниками и борьбе с изменением климата — той самой проблемой, которая побудила Баннера заняться наукой и машинным обучением.
Более высокие температуры приводят к более раннему сбору урожая: в период с 2015 по 2020 год урожай собирали в августе, а не в сентябре, чего не было в предыдущие 100 лет. В среднем вегетационный период сократился на 18 дней, что означает более короткий период созревания, а также более концентрированные, полнотелые фрукты и более низкую кислотность, одну из важнейших характеристик шампанского. Другими словами, потенциальное долгосрочное изменение профиля самого шампанского.
У крупных виноделов вроде Bollinger нет недостатка в инструментах, с помощью которых они могут адаптироваться под текущую ситуацию: можно снизить «дозировку» сахара, добавляемого в каждую бутылку после дегоржажа; менять сорта винограда и подвоя; даже время дня, когда собирают виноград. Смысл модели данных в том, чтобы точно определить события, которые наиболее явно влияют на качество, чтобы сделать наилучшую адаптацию. Так, датасет помог определить два элемента, которым ранее придавали мало значения.
Во-первых, оказалось, что ночная температура гораздо важнее, чем думали виноделы. Если ночью температура превышает 13 или 14 градусов по Цельсию, вторичный метаболизм лозы неэффективен, и корреляция с качеством становится заметно отрицательной», — говорит Баннер. Обилие прохладных ночей в 2014 году (несмотря на обжигающе жаркий июнь) было одним из факторов, указывающих на более сильный год.
Во-вторых, проблема водного стресса — последствия недостатка либо переизбытка воды за короткий период более серьёзны, чем предполагалось. И этот параметр будет увеличивать своё значение по мере того, как погодные условия становятся более непредсказуемыми.
Точно так же модель показала, что засушливые зимы, которые лишают почву достаточного количества воды в самом начале цикла, ещё до того, как на лозах распустятся бутоны (начало вегетационного периода), могут оказать явное влияние на качество в дальнейшем.
Лучшие условия для виноградников — это небольшой дождь каждый месяц, но не слишком сильный. Но в 2020 году, например, дождя не было два с половиной месяца. Если вы бежите марафон, и температура внезапно подскочила, вам нужно пить. Иначе у вас будет сильный стресс. Модель Bollinger показывает, что то же самое происходит и с виноградными лозами. Значит, можно внести изменения в уход за виноградниками, чтобы нивелировать вредное влияние климатических и иных параметров.
vassabi
машинное обучение трезвенника