14 ноября 2023 года команда Google Deepmind официально представила мировой общественности свою модель прогнозирования погоды – GraphCast. Её особенность заключается в том, что она способна рассчитывать погоду на 10 дней вперёд без понимания «физики» атмосферных процессов. Учёные обучали нейросеть на цифровых исторических архивах погоды за период с 1979 по 2017 годы. Сам же прогноз рассчитывается за минуту и не требует огромных суперкомпьютерных ресурсов. В тестах GraphCast смог обойти самую передовую гидродинамическую модель прогнозирования погоды от Европейского центра среднесрочных прогнозов. Рост качества был настолько существенным и резким, что в научной среде уже говорят о революции в сфере прогнозирования погоды. К чему это может привести и где смотреть самые точные прогнозы? Давайте разбираться.

Для начала представлюсь. Меня зовут Илья Винштейн, я синоптик из Кургана. Занимаюсь метеорологией 19 лет. Администрирую свой региональный проект «Погода 45» и «Синоптика». Давал несколько лекций для научно-просветительского проекта «Курилка Гутенберга».  

Как создаётся прогноз в XXI веке?

Рассказ о прогнозе погоды следует начать с того, как этот самый прогноз составляется в XXI веке. Главным источником всей прогностической информации являются глобальные численные модели атмосферы. Это программы, которые воспроизводят всю атмосферу Земли, начиная от почвы и заканчивая верхними слоями стратосферы. Главной пищей для моделей являются спутниковые данные во всех видимых и невидимых спектральных диапазонах, данные с кораблей, самолётов и аэрологических зондов. Данные наземных станций сейчас уже не имеют столь сильного влияния на качество прогноза, хотя и продолжают использоваться. Если исключить из моделей слой метеостанций, то качество упадёт на 7%, а если исключить спутниковые данные, то на 35-40%. В мире насчитывается 11 глобальных моделей и ещё десяток региональных.

Первые успешные эксперименты по численному прогнозу были проведены в 50-е годы XX века, когда появились первые компьютеры. Сложность моделей атмосферы прямым образом связана с теми вычислительными и интеллектуальными ресурсами, которыми обладает государство. По этой причине разработка и поддержание таких моделей является невероятно дорогим удовольствием. Не стоит забывать и про людей. За каждой моделью могут стоять сотни разработчиков, которые принимали участие в её создании в разные годы. Модели создаются в коллаборации университетов или даже стран. Классическим примером здесь является модель Европейского центра среднесрочных прогнозов (ECMWF).

ECMWF был создан в 1975 году в знак признания необходимости объединения научных и технических ресурсов метеорологических служб и институтов Европы для подготовки прогнозов погоды на среднесрочные сроки (примерно до двух недель). В Центре работает около 350 сотрудников, в основном назначенных из разных стран-участниц и сотрудничающих государств.

На протяжении почти 50 лет учёные развивали и совершенствовали свою модель, которая сейчас является самой лучшей в мире. Год за годом, шаг за шагом они внедряли обновления и допиливали свою модель до идеального состояния. Отмечу, что модель ECMWF в среднем обновляется раз в год. Последнее было в июне 2023 года. О нём я расскажу позже.

Качество прогнозов ECMWF на 3, 5, 7 и 10 суток. 500 hPa, Коэффициент корреляции аномалий.
Качество прогнозов ECMWF на 3, 5, 7 и 10 суток. 500 hPa, Коэффициент корреляции аномалий.

Качество прогнозов стабильно росло на протяжении десятков лет. Например, в 1986 году модель ECMWF прогнозировала поле давления на 3-е суток с точностью 90%. Сейчас этот показатель 98-99%. В 2000-м году на 7-м суток поле давления прогнозировалось с точностью 60%. За 20 лет показатель вырос до 80%! В 2005 году на 10-ть суток точность прогноза была 40%, а сейчас 50%. В научной среде этот прогресс даже имеет своё название – тихая революция. Достижения в области численного прогнозирования погоды представляют собой тихую революцию, поскольку они стали результатом постоянного накопления научных знаний и технологических достижений на протяжении многих лет.

Рейтинг глобальных прогностических моделей в 2022 году. Точность прогноза MSLP на 120 часов. Данные: ВМО
Рейтинг глобальных прогностических моделей в 2022 году. Точность прогноза MSLP на 120 часов. Данные: ВМО

Модель ECMWF занимает первое место в мире по качеству прогнозов. В 2022 году поле атмосферного давления (MSLP) на 5 суток она прогнозировала с точностью 90.5%. На втором месте находится британская модель UKMO. Разрыв между этими двумя моделями настолько существенный, что если бы модель ECMWF прекратила обновляться, то UKMO догнала бы её только через 6 лет. Идём дальше. Американская модель GFS отстаёт от ECMWF на 10 лет. Китайская модель на 17 лет, а российская ПЛАВ на 19 лет.

Сейчас мировые прогностические центры буквально выгрызают эти десятые доли процента, пытаясь приблизиться к уровню ECMWF. На многих графиках видно, что в последние годы качество прогнозов на средние сроки существенно замедлилось. Особенно это касается 7-10 суток. Высказываются мнения, что гидродинамические модели достигли своего пика развития. Здесь можно привести аналогию из теории относительности. Материальные объекты не могут достичь скорости света. Чем быстрее разгоняется объект, тем больше он затрачивает энергии для разгона. Со временем энергия преобразуется в массу самого объекта, тем самым необходимо затратить еще больше энергии на разгон. Каждый дополнительный м/сек даётся с большим трудом.

Здесь же можно вспомнить принцип Паретто, согласно которому 80% усилий дают 20% результата, а 20% усилий дают 80% результата. В начале нулевых качество прогнозов росло очень быстро, особенно после внедрения спутниковых данных. За период с 2000 по 2005 гг. прогноз на 10 суток стал точнее на 10%. С 2015 г. по настоящее время прогресс был лишь 5%.

Улучшение качества моделей требует колоссальных инвестиций в разработку, исследования и модернизацию оборудования. И страны Евросоюза готовы вкладывать в это огромные деньги. В 2017 году государства-члены центра приняли предложение итальянского правительства перенести центр обработки данных ECMWF в Болонью, Италия. Здесь же оказался новый суперкомпьютер Atos, купленный в 2020 году за 80 млн евро, что на тот момент можно сопоставить с годовым бюджетом Смоленска или Кургана. Он имеет 1 040 384 вычислительных ядра, а его производительность оценивается в 30 петафлопс. К слову, пиковая производительность самого мощного суперкомпьютера в России «Червоненкис» от Яндекса 29.4 петафлопс. Это технологическое обновление позволило ECMWF в июне 2023 года выбиться в лидеры ансамблевого прогнозирования, которое требует огромных вычислительных ресурсов.

Ансамблевое прогнозирование. Улучшаем качество без нейросетей

Один прогон (запуск) компьютерной модели – это в чистом виде детерминированный прогноз по принципу «как есть». Главной проблемой детерминированных прогнозов – являются ошибки в начальных данных, которые приводят к эффекту бабочки. Мельчайшие начальные возмущения приводят к огромным ошибкам в среднесрочной перспективе. Чтобы решить эту проблему учёные разработали ансамблевые прогнозы. Прогностический ансамбль, как правило, состоит из невозмущенного (контрольного) прогноза и возмущенных прогнозов, которые называются членами ансамбля. Иногда в качестве членов ансамбля также берутся прогнозы нескольких различных моделей (мультимодельный подход). Представьте себе обычный детерминированный прогноз. В этот прогноз с помощью генератора псевдослучайных чисел вносится искусственная ошибка. Каждый ансамбль состоит из 30-50 или 100 членов. Чем больше членов, тем выше качество. Разброс в ансамбле растет со временем, при этом среднее по полученным прогнозам при достаточно большом количестве членов ансамбля и хорошо подобранном возмущении может оказаться точнее, чем результат детерминированного прогноза. На этом и основан полезный эффект от использования прогностических ансамблей. Кроме того, наличие нескольких прогнозов с определенным разбросом на один и тот же срок дает возможность оценить вероятность тех или иных явлений погоды (к примеру, определенных значений осадков или температуры на заданном уровне), т.е. получить вероятностный прогноз. Например, если из 50 членов 40 выдают осадки, значит, вероятность осадков примерно 80%.

Ансамблевый прогноз температуры и осадков для Москвы. Ансамбль ECMWF
Ансамблевый прогноз температуры и осадков для Москвы. Ансамбль ECMWF

Усредние всех членов существенно снижает уровень шума. Поэтому средний прогноз начинает превосходить по качеству обычный детерминированный уже после 5-х суток. Разберём это на примере основной американской модели GFS. Её ансамбль называется GEFS (Global Ensemble Forecast System) и состоит из контрольного невозмущённого детерминированного члена и 30 членов с возмущениями в начальных данных. Из приведённых ниже данных видно, что на 1-4 сутки качество прогнозов GFS и GEFS находится на одном уровне. Уже с 5-х суток ансамбль постепенно начинает доминировать над GFS. В 2022 году модель GFS прогнозировала на 10 суток высоту изобарической поверхности 500hPa с точностью 46%, а её ансамбль GEFS показывал точность 60%. На 16-е сутки разница между GFS и GEFS достигала 14-15%. Если же сравнивать GEFS и EPS (ECMWF), то европейский ансамбль обходит американский на 5-7%, что очень существенно.

Качество прогнозирования поля 500 hPa.
Качество прогнозирования поля 500 hPa.

Детерминированная модель ECMWF прогнозирует поле 500 hPa на 10-е сутки с точностью 48%, а её ансамбль EPS выдаёт на 20% больше. Данные за осень 2021 года.

Ансамблевые прогнозы имеют существенные недостатки, которые затрудняют их использование и внедрение.

Во-первых, они слишком прожорливые. Ансамбль должен обновляться каждые 6 часов и рассчитывать параллельно 30-50 или 100 членов. Каждый член – это отдельный прогноз. Чем больше членов, тем выше качество. Только после покупки нового суперкомпьютера в ECMWF внедрили своё самое крупное ансамблевое обновление. Горизонтальное разрешение ансамблевых прогнозов средней дальности (ENS) увеличилось с 18 до 9 км, что соответствует текущему разрешению прогнозов высокого разрешения (HRES).  Существенные изменения также были внесены в прогнозы с расширенным диапазоном: теперь они выполняются ежедневно вместо двух раз в неделю, число членов ансамбля было увеличено с 51 до 101, и они выполняются с горизонтальным разрешением 36 км для всего диапазона прогноза, с 0 по 46 день. Ни один прогностический центр в мире не может себе такое позволить.

Во-вторых, есть большие проблемы с «отрисовкой» данных для массового потребителя. Ансамблевый прогноз визуально похож на веник или метёлку, что отпугивает обывателей. Усреднение данных сглаживает прогноз, что имеет практическую значимость для поля температуры, но абсолютно бесполезно для осадков. Поле осадков на 6-15 сутки размывается настолько сильно, что вычленить полезный сигнал из этого шума бывает крайне проблематично. Поэтому ансамблевые прогнозы плохо распространены на рядовых погодных сервисах. На ум только приходит прогноз на 14 дней от сайта «Foreca». Сам же сайт работает на базе модели ECMWF и публикует прогнозы со своей постобработкой. Все же остальные прогнозы на популярных сайта – детерминированные. Отсюда и их низкое качество на 7-15 сутки.

В-третьих, ансамбли плохо прогнозируют кратковременные потепления и похолодания. Речь идёт о событиях, которые охватывают 1-3 суток. За пределами 7-ти суток ансамбль сглаживается настолько сильно, что кратковременные и локальные явления просто размываются.

Нейросети. Первые шаги

Появление ансамблевых прогнозов – это второй этап развития гидродинамических прогнозов, который отчасти позволил решить проблему низкого качества прогнозов на 7-15 сутки. Другой этап – это постобработка сырых прогнозов. Ещё один способ улучшения «сырых» прогнозов. Повысить качество можно с помощью статистики или нейросетей. В России первая методика прогноза погоды на основе статистической интерпретации гидродинамических моделей появилась ещё в середине нулевых годов в Гидрометцентре России. Схему назвали РЭП (расчёт элементов погоды).  Для успешной работы системы статистической интерпретации (статистического постпроцессинга) необходимо создание соответствующей базы данных архива фактических значений прогнозируемых метеорологических элементов в пунктах прогноза, а также архивов полей объективного анализа и прогноза за определённый период лет. Прогностическая технология РЭП программно реализует полностью адаптивный алгоpитм самообучающийся по исходной дате на текущий сезон, на дату прогноза по заблаговременности. На входе используются данные моделей ECMWF, UKMO и GFS. Эта технология сейчас применяется на сайте Гидрометцентра России в автоматизированном прогнозе на 7-м суток для городов России. Схема РЭП заметно превосходит по качеству обычные гидродинамические прогнозы и прогнозы других популярных сервисов.

Существует и другая схема статистической обработки, которая существенно превосходит РЭП. В 2014 году руководитель отдела гидродинамических краткосрочных прогнозов Гидрометцентра России и заслуженный метеоролог Алексей Багров вместе со своей командой разработал простую, но принципиально новую статистическую схему обработки сырых прогностических данных. Она была опубликована в журнале «Метеорология и гидрология» в статье под названием «Комплексный прогноз приземных метеорологических величин».

Комплексный прогноз для Москвы на период с 21 по 26 ноября
Комплексный прогноз для Москвы на период с 21 по 26 ноября

Суть методики проста, но в этом её превосходство. Комплексный прогноз получен путём статистической обработки результатов включенных моделей. При этом для температуры воздуха, ветра и точки росы привлекается архив прогнозов за предшествующие 20 дней по соответствующим моделям и фактические данные на станции, а для осадков аналогичный архив за один год. Расчёт ведется отдельно для каждой станции и для каждой заблаговременности прогноза. Если ещё проще, то Багров предлагает выполнять статистическую корректировку прогнозов лучших моделей на основе фактических данных местной метеостанции. Детально методика описана в самой статье. Здесь я остановлюсь на некоторых основных моментах. Расчёт максимальной и минимальной температуры выполняется с учетом погрешности за последние 5 или 3 суток. Например, за последние 5 суток наши модели занижали температуру в среднем на 2 градуса, поэтому нам надо включить эту погрешность в последний прогноз и стабилизировать прогноз до наиболее вероятного значения. Таким образом, прогноз сам себя автоматически корректирует, опираясь на предыдущие отклонения в сторону завышения или занижения. 4 года прогноз находился в стадии тестирования. В сентябре 2018 года результаты тестов были опубликованы в журнале «Russian Meteorology and Hydrology».

Позже схема была улучшена с помощью нейросетей, а один из авторов методики Филипп Быков защитил диссертацию на тему «Постпроцессинг численных прогнозов приземных метеорологических параметров на основе нейросетевых методов». В научной работе очень подробно расписан принцип работы комплексного прогноза. На данный момент этот прогноз является самым лучшим в России, оставляя позади всех конкурентов.

Конечно, следует упомянуть про технологию распознавания зон выпадения осадков от Яндекса. В 2019 году разработчики выступили на 25-й конференции по обнаружению знаний и добыче данных, которая проходила в США. После был опубликован доклад «Прогнозирование осадков по спутниковым изображениям». Специалистам Яндекса удалось объединить данные радаров, спутниковые снимки и гидродинамические расчёты компьютерной модели GFS. На основе этих данных была разработана нейросетевая модель на архитектуре UNet, способная распознавать зоны выпадения осадков по геостационарным спутниковым снимкам. В качестве физической компоненты использовались поля американской модели GFS: интенсивность конвективных осадков, рабочая функция облаков, облачная вода, осаждаемая вода и конвективная потенциальная энергия на разных уровнях.

Выбор модели меня удивил, ведь GFS на самом деле крайне посредственная модель. Многие тесты показывают, что модель любит завышать количество осадков, а порой и выдавать ложные осадки. Куда лучше себя показывает немецкая модель ICON, которая обладает более высоким разрешением и имеет самую низкую ошибку прогнозирования осадков на коротких дистанциях. Думаю, что выбор пал на GFS по той простой причине, что модель является бесплатной, свободно распространяемой и рассчитывает массу параметров атмосферы. Её часто используют в исследовательских целях.

От себя добавлю, что Яндекс действительно очень неплохо распознаёт фактические зоны выпадения осадков. Проблемы начинаются, когда он пытается прогнозировать их перемещение. Если фронтальные осадки можно просто сдвинуть по воздушному потоку, то с конвективными осадками всё намного сложнее. Грозовые ячейки (тучи) способны очень быстро зарождаться и очень быстро деградировать. Тучи обычно определяются по температуре верхней границы облачности. Чем выше туча, тем ниже температура. Когда туча вырастает до 10-12 км, то нейросеть Яндекса фиксирует, что в заданной точке возникла туча, а, значит, под ней может идти дождь. Поэтому нейросеть отрисовывает зону выпадения осадков, которая в точности совпадает с размерами этой тучи по верхней границе облачности. Раз туча возникла, значит, её надо сдвинуть по воздушному потоку в пределах 2-х часов. Здесь-то и начинаются проблемы. Грозовые ячейки – это сложные физические объекты. Туча за 2 часа может увеличиться в десятки раз, а вместе с ней увеличиться и зона выпадения осадков. Поэтому недостаточно просто сдвинуть зону осадков по потоку. Необходимо спрогнозировать эволюцию этой грозовой тучи, а это самая сложная задача. Я неоднократно замечал, как Яндекс сдвигал такие тучи на 2 часа вперёд, хотя по спутнику они уже начинали деградировать. Нейросеть Яндекса не понимает, что это не просто плоское пятно осадков, а объёмный физический объект со своей структурой и жизненным циклом. Поэтому когда я слежу за грозовой активностью, то вынужден комбинировать данные Яндекса и спутника.

Что же касается температуры, то здесь Яндекс не демонстрирует ничего сверхъестественного.  Независимые оценки (см. диссертацию Быкова) показывают, что Яндекс существенно уступает РЭП и Комплексному прогнозу. Оценки Гидрометцентра за май-июль 2022 года демонстрируют, что Яндекс в дневном и ночном прогнозе температуры на 24 часа занимает третье место после РЭП и Комплексного прогноза. Сравнительная оценка производилась для 53-х городов России.

Сравнительная оценка прогнозов температуры воздуха. 53 города России. Гидрометцентр России. Май-июль 2022 года.
Сравнительная оценка прогнозов температуры воздуха. 53 города России. Гидрометцентр России. Май-июль 2022 года.

«Чёрный ящик» прогнозирует погоду

Из приведённого выше обзора видно, что машинное обучение преимущественно использовалось для постобработки сырых данных. Никто не пытался использовать нейросети для создания полноценных моделей прогнозирования погоды. Первые тесты на сетках с низким разрешением показали, что создание таких систем не является невыполнимой задачей. В 2023 году нейросетевые модели стали возникать в открытом доступе одна за другой. На конец ноября их насчитывается уже 4 штуки: FourCastNetv2-small от Nvidia, Graphcast от Google, Pangu-Weather от Huawei и AIFS от ECMWF. Далее их краткое описание:

FourCastNetv2-small: следующая итерация системы глубокого обучения FourCastNet, разработанная компанией Nvidia и ее сотрудниками. В этой модели используются сферические нейронные операторы Фурье для учета пространственных зависимостей. Данная модель представляет собой уменьшенную версию, которая может поместиться в один накопитель Nvidia A100 40 ГБ для проведения вычислений. Она была обучена с помощью ERA5 для минимизации среднеквадратичной ошибки прогноза и работает при 0,25°.

Graphcast: система на основе глубокого обучения, разработанная Google Deepmind. В ней используется архитектура графовой нейронной сети со структурой кодер-процессор-декодер с многосеточным представлением. Модель была обучена на реанализе ERA5 с разрешением 0,25° и отлажена на прогнозе ECMWF HRES с целью минимизации среднеквадратичной ошибки прогноза.

Pangu-Weather: система на основе глубокого обучения, разработанная компанией Huawei. Она использует архитектуру 3D-трансформера для учета пространственных зависимостей и состоит из нескольких моделей, позволяющих делать прогнозы на различных временных интервалах (например, 24 часа, 6 часов). Она была обучена с помощью ERA5 для минимизации среднеквадратичной ошибки прогноза для каждой модели и работает при 0,25°.

AIFS: система на основе глубокого обучения, разработанная в ECMWF. Используются графовые нейронные сети. Обучение происходило на основе реанализа ERA5. AIFS имеет 13 уровней давления, работает с разрешением около 1 градуса и позволяет прогнозировать ветер, температуру, влажность и геопотенциал. На поверхности AIFS делает прогнозы для температуры на 2 м, ветра на 10 м, приземного давления и т.д. AIFS была обучена минимизировать среднюю квадратичную ошибку.

Прогноз приземной температуры на высоте 2-х метров на 180 часов. GraphCast
Прогноз приземной температуры на высоте 2-х метров на 180 часов. GraphCast

Отчётливо видно, что у всех моделей есть одно общее свойство – они все обучались на реанализе ERA5. Реанализы – это цифровые архивы погодной информации. Они позволяют изучать погоду даже в тех местах, где очень редкая сеть метеостанций. В какой-то степени можно сказать, что реанализ – это прогон гидродинамической модели нулевой заблаговременности, а т.к. модель ECMWF является лучшей в мире, то и их реанализ является эталонным. По этой причине ERA5 и использовался для обучения нейросетевых моделей.

Актуальные тесты за лето показали, что качество FourCastNet и Pangu-Weather сопоставимо с гидродинамическим прогнозов IFS от ECMWF. GraphCast и AIFS сумели существенно превзойти лучшую модель в мире. Классическая детерминированная версия ECMWF прогнозирует температуру на уровне 850 hPa (1500 метров) на 10 суток с показателем 36-37%. Машинное обучение повышает точность до 45%! Рост качества происходит на всех сроках заблаговременности. Барическое поле на 8-10 суток новая нейросетевая модель прогнозирует на 5-8% точнее, чем обычная версия ECMWF.

Качество прогнозирования температуры на уровне 850 hPa (1500 метров).
Качество прогнозирования температуры на уровне 850 hPa (1500 метров).

На графике видно, что AIFS и GraphCast идут ноздря в ноздрю. Нейросетевая модель AIFS появилась позже, чем модель от Google. Сами же разработчики AIFS пишут, что изучали все остальные модели и остановились на той же самой архитектуре, которую выбрал Google. Подозреваю, что в ECMWF поняли, что их гидродинамическая модель больше не будет самой лучшей в мире и решили оперативно разработать свою собственную, чтобы не отставать от Google.

Но всё-таки у Google научная статья вышла раньше. В ней разработчики пишут, что  «GraphCast обладает более высокими навыками прогнозирования погоды, чем HRES (ECMWF), при оценке 10-дневных прогнозов с горизонтальным разрешением 0,25° по широте/долготе и на 13 вертикальных уровнях. GraphCast имеет более высокие оценки мастерства на всех временных интервалах, причем улучшение мастерства составляет примерно 7%-14%. GraphCast превзошел HRES по 90,3% из 1380 целей, причем значительно (p ≤ 0,05, номинальный объем выборки n ∈{729, 730}) превзошел HRES по 89,9% целей.  При исключении уровня 50 гПа GraphCast значительно превосходит HRES по 96,9% из оставшихся 1280 целей. При исключении уровней 50 и 100 гПа GraphCast значительно превосходит HRES по 99,7% из 1180 оставшихся целей. При оценке по регионам мы обнаружили, что предыдущие результаты в целом сохраняются по всему земному шару. Мы также сравнили производительность GraphCast с лучшей конкурирующей ML-моделью погоды Pangu-Weather и обнаружили, что GraphCast превзошел ее на 99,2% из 252 представленных задач».

Превосходство GraphCast над HRES от ECMWF
Превосходство GraphCast над HRES от ECMWF

Исследователи обнаружили, что качество прогноза зависит от размера обучаемой выборки.

«GraphCast можно периодически переобучать на свежих данных, что, в принципе, позволяет отражать погодные закономерности, изменяющиеся во времени, такие как последствия изменения климата и длительные климатические колебания. Мы обучили четыре варианта GraphCast с нуля на данных, которые всегда начинались в 1979 году, а заканчивались в 2017, 2018, 2019 и 2020 годах соответственно (вариант, заканчивающийся в 2017 году, мы обозначили как "GraphCast: <2018" и т.д.). Мы сравнили их показатели с HRES на тестовых данных 2021 года. Мы обнаружили, что, хотя производительность GraphCast при обучении до 2018 года остается конкурентоспособной по сравнению с HRES в 2021 году, обучение до 2021 года еще больше улучшает его показатели. Мы предполагаем, что этот эффект давности позволяет улавливать последние погодные тенденции для повышения точности. Это показывает, что производительность GraphCast может быть улучшена путем повторного обучения на более свежих данных.»

Способность обучаться на основе растущих архивов прошлых метеорологических данных является ключевым преимуществом моделей ИИ. «Это потенциально может повысить точность прогноза за счет улавливания закономерностей и масштабов в данных, которые нелегко представить в явных уравнениях», – пишут авторы, разработавшие модель, в своем исследовании.

«Обычная мудрость гласит, что использование [искусственного интеллекта] может быть не столь эффективным в редких, необычных случаях. Но, похоже, он справился с этой задачей», – сказал в интервью The Washington Post Питер Батталья, директор по исследованиям Google DeepMind и один из соавторов исследования. «Мы считаем, что это также указывает на то, что модель улавливает нечто более фундаментальное в том, как погода развивается во времени, а не просто ищет более поверхностные закономерности в данных».

В чём революционность? Перспективы развития

Как я уже писал выше, все прогностические центры буквально выгрызают десятые доли процента, пытаясь увеличить качество прогноза выше статистической погрешности. Например, в ECMWF точность прогноза высоты изобарической поверхности 500 hPa в летний период колеблется от 35.3% до 46.7%. За 16 лет (2007-2022) средний показатель 41.3%. У GraphCast и AIFS в этом году точность была 51%, что сразу на 10% выше, чем среднее за 16 лет. Этот скачок произошёл буквально в пределах одного года. У ECMWF могли бы уйти десятки лет упорной и кропотливой работы, чтобы вывести точность за пределы 50%. Таких цифр можно достичь с помощью ансамбля, который уже существует и способен на это, но детерминированные модели ещё никогда так резко не прибавляли в качестве.

Качество прогнозирования высоты изобарической поверхности 500 hPa. 10 суток. Лето. Северное полушарие. Синие столбики - гидродинамический прогноз ECMWF. Красный столбик - прогноз нейросетевой модели AIFS от ECMWF
Качество прогнозирования высоты изобарической поверхности 500 hPa. 10 суток. Лето. Северное полушарие. Синие столбики - гидродинамический прогноз ECMWF. Красный столбик - прогноз нейросетевой модели AIFS от ECMWF

Нейросеть, обученная на цифровых архивах погоды, смогла за коротких промежуток сделать работу, на которую люди потратили бы десятки лет. Машинное обучение помогло найти долгоиграющие причинно-следственные связи в атмосферных физических процессах. Чем дальше срок прогноза, тем выше качество по сравнению с обычной гидродинамической моделью. Это означает, что нейросеть видит длинные нити, которые не смогли увидеть люди, занимавшиеся разработкой модели ECMWF в течение 50 лет.

Сравнение AIFS (нейросеть) и классической IFS от ECMWF. Качество прогнозирования температуры на уровне 850 hPa (1500 метров)
Сравнение AIFS (нейросеть) и классической IFS от ECMWF. Качество прогнозирования температуры на уровне 850 hPa (1500 метров)

Ещё один интересный момент заключается в том, что Google изначально не позиционировали себя, как метеорологический или прогностический сервис. ECMWF же это старейшая метеорологическая организация, вобравшая в себя лучших специалистов и учёных со всей Европы. В Google Deepmind смогли за очень короткий промежуток времени создать погодную модель, которая превзошла по качеству модель, на сборку которой ушло 50 лет. Они решили задачу другим путём, который оказался проще, дешевле и качественней.

Перспективы у таких нейросетевых моделей очень большие. Самое главное – это ансамблевые прогнозы, которые должны быть ещё точнее, чем обычные гидродинамические ансамбли на 7-15 сутки. В июле 2023 года исследователи из Китая показали, что нейросетевые модели могут быть использованы для создания ансамблевых прогнозов. Демонстрация проводилась на основе модели Pangu-Weather от HUAWEI CLOUD.

Далее фрагмент из исследования:

«Как метод, основанный на искусственном интеллекте, Pangu-Weather работает более чем в 10 000 раз быстрее, чем оперативные IFS от ECMWF. Это дает возможность выполнять прогнозы ансамбля из большого числа элементов с небольшими вычислительными затратами. Мы исследовали FourCastNet2 для изучения предварительного ансамблевого метода, который добавляет возмущения к исходным погодным состояниям. Затем мы сгенерировали 99 случайных возмущений и добавили их к невозмущенному исходному состоянию. Таким образом, мы получили прогноз ансамбля из 100 членов путем простого усреднения результатов прогноза. Для каждой переменной среднее значение по совокупности немного хуже, чем при использовании метода с одним элементом в краткосрочных прогнозах погоды (например, на 1 день), но значительно лучше, когда время выполнения составляет 5-7 дней. Это согласуется с FourCastNet2, указывая на то, что ансамблевые прогнозы с большим количеством элементов особенно полезны, когда точность одной модели ниже, однако они представляют риск внесения неожиданного шума в краткосрочные прогнозы. По сравнению с методами ЧПП, Pangu-Weather в значительной степени снижает стоимость ансамблевого прогнозирования, позволяя метеорологам применять свой опыт для контроля шума и повышения точности ансамблевого прогноза».

Красная линия - контрольный прогноз Pangu-Weather. Синяя линия - ансамблевый прогноз Pangu-Weather.
Красная линия - контрольный прогноз Pangu-Weather. Синяя линия - ансамблевый прогноз Pangu-Weather.

О создании своей ансамблевой нейросетевой модели пишут в ECMWF: «Одним из наших дальнейших важных шагов, о котором мы будем подробнее говорить в будущем, является разработка ансамблевой системы. В настоящее время основным предложением IFS является ансамблевая система прогнозирования, поскольку мы знаем, что это наиболее эффективный способ составления прогнозов на средние расстояния».

Следующий этап – это создание долгосрочных нейросетевых моделей, которые будут прогнозировать общую циркуляцию на месяцы вперёд. Все современные долгосрочные модели являются гидродинамическими и тяжеловесными. Они требуют ещё больше ресурсов, чем ансамблевые. Вполне возможно, что в будущем мы увидим мультимодельные долгосрочные нейросетевые прогнозы, которые будут существенно снижать уровень шума по сравнению с классическими гидродинамическими моделями.

За долгосрочными моделями последуют климатические, которые уже будут рассчитывать параметры атмосферы на десятки и сотни лет вперёд. Для начала такие модели должны правильно рассчитать климатические состояния в прошлые эпохи, а уже затем можно будет говорить о высокой значимости таких моделей. Современные гидродинамические модели климата имеют ряд ограничений. Они все еще не могут полностью учитывать все соответствующие климатические процессы. Это происходит, с одной стороны, потому, что некоторые процессы еще недостаточно изучены, а с другой стороны, потому, что детальное моделирование заняло бы слишком много времени и потребовало бы слишком большой вычислительной мощности. Например, им сложно воспроизводить петли обратные связи. Чем дальше прогноз от начальной точки, тем сильнее себя могут проявлять эти связи, давая существенный разброс в параметрах. Например, не совсем ясно, как себя будет вести многолетняя мерзлота, содержащая в себе огромные запасы метана. По мере роста температуры мерзлота будет оттаивать (этот процесс уже пошёл), выбрасывая всё больше метана, который являясь сильным парниковым газом, будет ещё больше разогревать планету, усиливая таяние мерзлоты и выбросы метана и т.д. Нейросетевые модели могут помочь в решении проблемы обратных связей. 

Важно понимать, что это ещё только начало пути. Маловероятно, что синоптики резко откажутся от классических гидродинамических моделей в ближайшие годы. Всё-таки этими инструментами специалисты пользовались десятки лет. Под них создавалась вся инфраструктура и нормативная документация. Нейросетевые модели – это новый дополнительный инструмент, который позволит перепроверять обычные гидродинамические прогнозы. Вполне возможно, что в будущем мы получим некий симбиоз между машинным обучением и гидродинамикой. Это позволит сделать прогнозы ещё точнее.

Где смотреть прогнозы?

На данный момент все прогнозы нейромоделей представлены на сайте ECMWF в разделе «Experimental: Machine learning models». Табличных прогнозов и графиков пока нет, но уверен, что в будущем они появятся.

Другие прогнозы:

Комплексный прогноз. Самый точный прогноз температуры и скорости ветра. 

Ансамблевые прогнозы от ECMWF для Москвы. Город можно поменять. 

 

Комментарии (56)


  1. ReadOnlySadUser
    21.11.2023 02:06
    +6

    Ничего не понимаю в обсуждаемой теме, но после прочтения возник вопрос. Если порог наших предсказаний погоды - это условные 10 дней, то на чём тогда базируются всякого рода климатические исследования, в которых предсказываются разные изменения погоды на планете под влиянием действий человека? Судя по всему, мы не сильно-то понимаем, как те или иные факторы влияют на погоду в долгосрочной перспективе.


    1. fantast8 Автор
      21.11.2023 02:06
      +35

      Физический порог прогнозирования погоды 14 суток. За пределами 14-ти суток нельзя сказать, какая температура будет 3 декабря в 14 часов дня. Для климатических же и долгосрочных прогнозов такая точность не нужна. Это разные прогнозы. Климатические модели рассматривают более обширные временные периоды и усредненные значения для определения статистических закономерностей. Прогнозируется уже не погода, а климатические характеристики и общие параметры атмосферы. Поэтому все климатические модели являются ансамблевыми. Один запуск может содержать сотни членов, что подразумевает вариативность. Среднее снижает уровень шума. Для климатических моделей важен энергетический баланс. Он описывает равновесие между солнечным излучением, поступающим на Землю, и излучением, которое планета излучает обратно в космос. Углекислый газ, особенно углекислый газ, является одним из так называемых парниковых газов, который влияет на тепловое равновесие путем удержания тепла в атмосфере. Поэтому есть базовые сценарии выбросов СО2, которые закладываются в модели и на основе этих выбросов рассчитывается изменение температуры. На самом деле первая такая математическая модель была создана советским климатологом Михаилом Будыко, который построил прогноз изменения температуры на Земле на 100 лет с учётом роста выбросов СО2. Его модель работает по сей день, а её качество сопоставимо с самыми сложными климатическими моделями.


      1. ReadOnlySadUser
        21.11.2023 02:06
        +1

        Спасибо за развёрнутый ответ.


      1. isden
        21.11.2023 02:06

        Физический порог прогнозирования погоды 14 суток.

        Где-то читал, что более-менее достоверным можно считать срок до 3 суток.


        1. JediPhilosopher
          21.11.2023 02:06

          Ну там смотря что вам надо от прогноза. Температуру предсказывает лучше, ветер хуже, осадки еще хуже. Для температуры на неделю худо-бедно можно смотреть, а вот ветер дальше чем на 2-3 дня да, более-менее бесполезно, если вам нужна точность (как нам для полетов на парапланах)


        1. fantast8 Автор
          21.11.2023 02:06
          +1

          Это заблуждение уровня начала 00-х годов. Сейчас практической значимостью обладает предел до 192 часов (7 суток). До этого срока средняя ошибка меньше 3-х градусов. На 8-15 сутки средняя абсолютная ошибка уже от 3 до 6 градусов.


          1. JediPhilosopher
            21.11.2023 02:06
            +1

            А что насчет силы и направления ветра сейчас? Меня лично вот это в основном интересует. И тут ощущение, что все еще грустно, и дальше суток-двух смотреть бесполезно, разве что очень общие тенденции. Потому что нам точность важна, и плюс-минус 2-3 м/с уже может означать разницу между летной и нелетной погодой. Как и направление - плюс-минус 10-15 градусов и уже динамический восходящий поток на горе не образуется.


            1. arheops
              21.11.2023 02:06
              +4

              Да где-то так же. Просто вы не совсем понимаете модель.

              Когда там wrf-9 это значит, что в слое в 50м от поверхности на пяточке в 9 км радиусом В СРЕДНЕМ ветер будет такой то. Где-то. На какой-то высоте. А какой будет у вас на аеродроме - ну тут до сих пор бабка лучше скажет.

              Термики и местные преграды размером сильно меньше 9км, модель, естественно, не учитывает и там ветер непрогнозируем.


              1. vadimk91
                21.11.2023 02:06

                Что ветер непредсказуемем даже над водоемами, убедждался неоднократно. Недалеко у нас озеро, летом хожу купаться. У берега есть несколько узких длинных островов и чуть ветер поменяет направление - то образуется мертвая зона, то наоборот, сильные волны. Придёшь, посмотришь на воду - вроде тихо, поплыл, а через 10 минут как будто скоростной катер мимо пролетел - волны, но никого нет. В наших местах можно верить прогнозу, если только там написано "штиль" :)


              1. JediPhilosopher
                21.11.2023 02:06

                Да это понятно все. Но на что еще смотреть, кроме этих моделей? Все-таки тенденцию они показывают. В горах, конечно, совсем плохо, но на наших равнинах погода в радиусе 4-5 км все-таки не сильно меняется (кроме местных конвективных осадков).


                1. arheops
                  21.11.2023 02:06

                  Надо корректировать модель с учетом экспертного мнения старожилов ;)

                  Посмотрев прогноз и сравнив с ощущениями за два-три года вы научитесь угадывать.

                  Это вы считаете, что не меняется. Идет фронт, холмик в 20 метров или два тополя - все, фронт ветра ушел на высоту в 10-15м и вернется через 200-300 метров обратно. Модель даже не знает про холмик.

                  К примеру, у меня на споте я точно знаю, что если ветер восток или юго восток - пусть там и 10мс пишет - его не будет. А для севера +2мс.


            1. Glen5
              21.11.2023 02:06

              Вроде в windy сейчас можно недели за две планировать «летный день». Мне правда наоборот нужно сильный ветер, для кайта, вот с этим вроде ни разу не подводил.


              1. JediPhilosopher
                21.11.2023 02:06

                Не знаю, две недели это совсем пальцем в небо мне кажется. Неделя и то часто мимо - оно показывает подходящий ветер вроде в нужный день, но за неделю этот прогноз сдвигается на день туда-сюда. То есть тенденцию что в целом будет северо-запад оно показывает, но вот будет ли он в пятницу вечером или в субботу днем - это уже становится ясно только за день-два.

                Поэтому обычно смотрим за неделю, а окончательное решение о полетах вечером накануне. И то иногда бывает, что с утра еще прогноз смотришь - а он уже поменялся, может не так сильно, но для нас и пара м/с может уже быть критичной.


      1. Scout_00
        21.11.2023 02:06

        В конце 90-х годов в журнале "Природа и человек(Свет)" публиковались долгосрочные прогнозы на сезон: осень, весну и т.д. по районам России (Центрально-Черноземный, Уральский и т.д.) Прогнозы были достаточно достоверные по температуре и осадкам, типа такого: "в первую неделю сентября в Приволжско-Уральском регионе средняя температура ..., осадков не ожидается. Во второй половине сентября станет холоднее, до ..., осадки ... В Западной Сибири... На Дальнем Востоке .... "

        Потом прогнозы пропали, видимо, с уходом человека, который ими занимался. Не подскажете, на основании чего они делались?


    1. Nik2008
      21.11.2023 02:06
      +1

      Пол+палец+потолок)) но все должны скинуться на глобальное потепление!!

      Недавно один деятель на голубом глазу заявил, что замена автобусов на электробусы позволила снизить загрязнение воздуха аж на 80%)) оказывается во всем были виноваты автобусы, а не металлургический комбинат)) Вот так и с погодой)


      1. ru1z
        21.11.2023 02:06
        +3

        Это про мосгортранс что ли? https://mosgortrans.ru/press/news/my-sokratili-vybrosy-co-na-36-tysyach-tonn-posle-zameny-dizelnykh-avtobusov-na-elektrobusy-v-2022-go/ ?

        Ну так там наверное снижение загрязнения от конкретного источника (транспортной компании) до и после, а не срез абсолютно всех источников загрязнения. Т.е. были источники загрязнения - дизельные автобусы, они загрязняли воздух где-то в Москве. Потом их заменили на электротранспорт и обещают, что воздух в Москве стал лучше. Ну, на 80%, наверное, нет, там действительно еще много предприятий, вы правы, но там, где нет металлургических предприятий, воздух, наверное, будет чище. То есть замена огромного парка автобусов в Москве, наверное, все-таки (локально) поможет, а в проблемном Красноярске без замены заводов ничего не изменится.

        А так, локальное загрязнение города ведь тоже проблема. Это же не углекислый газ даже, а продукты неполного сгорания (монооксид, сажа, ароматика), серу/азот-содержащие газы, разные катализаторы и все это с доставкой к родному подьезду. Электротранспорт, возможно слишком идеализируют, но здесь какая-то логика присутствует, имхо.


  1. adeshere
    21.11.2023 02:06
    +6

    Спасибо за отличную статью!!

    Но спросить я хотел не про нее, а про модель ERA5.Дело в том что пару лет назад мы вычисляли гравиметрический нагрузочный эффект атмосферы, используя данные реанализа, и наткнулись там на явную лажу. А именно, дважды в сутки, в 9-10 и 21-22ч по Гринвичу, среднеглобальное атмосферное давление (осредненное по всему шарику) испытывает гигантский скачок с амплитудой в отдельных случаях до 0.05ГПа. Для сравнения, чтобы оценить масштаб катастрофы: сезонный ход среднеглобального давления (=массы атмосферы Земли) всего лишь в 10 раз больше этой величины...

    Если у нас в наших расчетах нет ошибки, то это совершенно очевидный баг модели. Но мы не смогли достучаться до кого-то из ее авторов, чтобы прояснить этот вопрос. Надеялись это сделать после выхода английского перевода нашей статьи, где

    описана проблема

    ей посвящен раздел "Проблема скачкоообразного изменения массы атмосферы при использовании данных ERA", см. формулу (1) на с.92 и рис.1 на с.93; полный текст статьи можно взять вот тут.

    Но к этому моменту мой соавтор, который скачивал данные реанализа и раскладывал их по сферическим функциям, покинул этот мир. А у меня самого с английским проблемы... Ну и к тому же мое участие в этой публикации - это сугубо временные ряды, так что лезть с этим глюком к метеорологам мне как бы и не по рангу...

    Если Вы знаете, в чем тут дело, или кому надо задать этот вопрос (желательно русскоговорящему) - буду благодарен за подсказку.

    Потенциально

    ошибка может быть как в самой модели ERA5, так и в алгоритме интегрирования, за который отвечал мой соавтор. Но он божился, что у него все в порядке. Ну и если это ошибка у него, то очень странная: ошибка смещается во времени, имеет разную амплитуду в разные дни и т.д. Так что независимо проверить модель было бы очень не вредно. Ведь если вдруг все действительно так, то нужно трубить во все колокола и разбираться с причинами. Это ведь то же самое, как если бы на лучшей в мире заправке вам заливали бак с точностью плюс-минус поллитра (правда, с выравниваем баланса в среднем за много заправок).

    Не может же быть, что всем пофиг...


    1. fantast8 Автор
      21.11.2023 02:06
      +1

      Впервые читаю про такую проблему. В научной литературе не встречал. Но Вы можете поверить данные по другим реанализам. Например. NCAR, CFSR или японский JRA-55


      1. adeshere
        21.11.2023 02:06

        Впервые читаю про такую проблему. В научной литературе не встречал. Но Вы можете поверить данные по другим реанализам. Например. NCAR, CFSR или японский JRA-55

        Уже не можем :-(((

        Меня в эту работу позвали практически с улицы, только чтоб временные ряды покрутить. По сути, я там не в теме вообще. Просто заметил вопиющий артефакт по своим "пуговицам", то есть во временном ряде. Что называется, WTF!?

        А в ответ, к сожалению, тишина...

        Так что я сам продолжать эту тему

        точно не буду

        Я даже модельное давление по поверхности проинтегрировать не возьмусь. В любых данных надо ведь разобраться сперва, прежде чем как-то использовать. Я уж не говорю о том, что их еще сперва надо скачать и форматы подстроить.

        Правильнее, чтобы в этом все-таки настоящий специалист поучаствовал, который эти данные (поля срочных давлений на сетке) каждый день в своих приложениях крутит и все их тонкости знает. Если вдруг кто-то такое поле проинтегрирует, и временные ряды выгрузит - то дальше я все тесты за пару дней проведу, т.к. это уже вполне

        по моей части задачка

        Это предложение можно считать публичной офертой ;-)

        Только вот никому это особо не интересно, похоже.

        P.S. Вообще, если бы мне сказали, что моя программа (модель) при расчете синусоиды дает на выходе меандр со скачками, то я бы все бросил, и полез проверять: в чем дело. Чтобы причину этой конкретной ошибки найти. А главное, убедиться, что этот глюк (если он и правда в моей программе) еще где-то какую-то фигню не плодит. А тут никто даже и

        не удивляется

        (ну, кроме меня ;-)

        что и странно. Я даже не про нашу статью говорю (у нее другая ЦА, синоптики могли и не заметить), а про ответы на письма, которые Женя успел получить. "Да, то что модель дает 2х2=5, это странно... но я сам эту модель использую для вычисления 2х3, и по этой части меня ее результаты вполне устраивают".


        1. vadimk91
          21.11.2023 02:06

          По существу я конечно Вам ничего не скажу, но пару раз сталкивался со странным эффектом в прогнозах от Foreca, упоминается в этой статье - оказывается они сами занимаются обработкой данных. Их прогноз кажется мне наиболее точным для моего региона (Карелия), но несколько лет назад прогноз вроде как на 5й день выдал по температуре какие-то дикие цифры, а ещё раз что-то типа нарастающей "в разнос" синусоиды. Тогда писал разработчикам приложения, сказали исправят, больше не встречалось. Что было первопричиной этой ошибки мне неизвестно.


  1. dekeyro
    21.11.2023 02:06

    Если я правильно понимаю, подобная модель хорошо предсказывает погоду по "штатному" расписанию. Какие-либо торнадо и прочие вещи возникающие редко, но способные поменять климат в отдельно взятом районе/регионе они естественно не предскажут.
    И сразу идет следующий вопрос - а доучивание моделей как оперативно будет выполняться? Прошел год, допустим он был аномальным. Его в базу тоже нужно внести же?


    1. Limping
      21.11.2023 02:06

      Подумал ровно о том же.
      И дело не только в торнадо. Просто наступление холодного фронта, или существенные осадки - уже прогнозируются у нас очень плохо :-(

      Я понимаю, этот фронт может в прогнозе сдвигаться плюс-минус 100 км. буквально за считанные часы, или пойдёт западнее или восточнее, и от этого погода в конкретной точке будет диаметрально разной.


    1. fantast8 Автор
      21.11.2023 02:06

      Торнадо и прочие явления относятся к конвекции. С ними даже гидродинамические модели плохо справляются. Грозы, шквалы, ливни, град - все эти конвективные явления не воспроизводятся моделями прямо. Их прогнозируют на основе косвенных параметров. Например, содержании влаги в атмосфере, потенциальной энергии конвективной неустойчивости, высотных параметрах атмосферы и т.д. Прогноз таких явлений лучше по обширным площадям, чем по отдельным точкам. Но отмечу, что прогресс в этой области всё-таки есть, за счёт увеличения разрешения моделей и внедрения мезомасштабных моделей с сеткой 6.6 км и меньше.


  1. Limping
    21.11.2023 02:06

    А какую модель использует норвежский Yr.no ?
    https://yrkundesenter.zendesk.com/hc/en-us/articles/206550539-Facts-about-Yr - тут пишут что вроде как собственная модель.

    По субъективному ощущению, он не хуже ECMWF


    1. dom1n1k
      21.11.2023 02:06

      Если упрощенно, то у них собственная локальная модель для Скандинавии и ECMWF для остального мира.
      https://hjelp.yr.no/hc/en-us/articles/360004008874-Weather-forecasts-on-Yr-how-are-they-made-


      1. Limping
        21.11.2023 02:06

        Ага, теперь понятно почему в программе Windy где-то до Арзамаса/Сарова есть ICON-EU, а восточнее остаётся только ECMWF.


        1. fantast8 Автор
          21.11.2023 02:06

          ICON-EU. это версия высокого разрешения для Европы, она обрезается где-то по Уралу. Но у них есть и глобальная версия с сеткой 13 км.


  1. JediPhilosopher
    21.11.2023 02:06
    +2

    Ой как интересно. А может напишите еще статей по предсказаниям погоды? Тема-то очень классная, и с ИТ прекрасно стыкуется.

    Я сам летаю на параплане, нас вообще очень интересует это все. Так как чтобы понять, удастся ли завтра полетать и не засосет ли в какую-нибудь грозу, в погоде таки надо научиться разбираться.

    Интересно было бы узнать, например, как посчитать локальную модель для какого-то одного летного места. Иногда энтузиасты этим занимаются, получается неплохо. Как я понимаю, они обычно берут какую-то сборку WRF и запускают у себя. Вот это вообще прям для Хабра тема.

    Очень интересно нам, пилотам парящих ЛА, предсказание конвекции. Мы летаем в восходящих потоках, а с ними вообще все сложно. Может быть прекрасный солнечный день, а потоков нет - воздух стабильный, инверсия или еще какая шляпа. А бывает наоборот, вроде пасмурно и дождик покапывает, а везде прет вверх на большой территории. Есть ли какие-то хорошие модели и инструменты именно для этого?

    Есть сайты для пилотов типа XCSkies, прогнозирующие восходящие потоки, но мне кажется что качество там так себе. Ну и они не рассказывают особо о своих моделях, это их коммерческая тайна.

    Куда лучше себя показывает немецкая модель ICON

    У нас в Питере шутят, что если не хочешь завтра летать - смотри прогноз ICON и оставайся дома. Конкретно для наших летных мест в Ленобласти ICON постоянно обещает какие-то катаклизмы и осадки, которых потом не случается.

    Поэтому когда я слежу за грозовой активностью, то вынужден комбинировать данные Яндекса и спутника

    Ну у нас спутников нет, есть только Яндекс, и в целом он неплох. И даже конвективные осадки чаще угадывает, чем нет. И вот стоишь на поле, видишь туча на горизонте ходит, приходится решать - лететь или нет, и если лететь - то куда. Вот Яндекс бывает подскажет что до нас она не дойдет. Или наоборот, дойдет и лучше посидеть на земле. Понятное дело, что потом в полете все равно надо глазами смотреть как оно на деле развивается, но помощь в принятии решений он хорошую оказывает.

    Hidden text

    Вообще мне кажется, что СЛА - отличное хобби для метеоролога, можно всю эту погоду буквально потрогать руками и ощутить на своем лице )


    1. fantast8 Автор
      21.11.2023 02:06

      Объективные данные показывают, что ICON лучше всех прогнозирует скорость ветра на коротких дистанциях. Вот данные за октябрь. Сначала идёт Комплексный прогноз, а уже затем ICON.


      1. JediPhilosopher
        21.11.2023 02:06

        Вот это неожиданно. Но с осадками там обычно так все грустно, что скорость ветра по ней уже никто не смотрит.

        А этот Комплексный прогноз можно увидеть в каком-то человеческом формате? Ну чтобы точку на карте ткнул и увидел в ней все значения, как на обычном погодном сайте?


        1. fantast8 Автор
          21.11.2023 02:06

          ICON лучшая модель для прогнозирования осадков до 72 часов. У неё самая низкая средняя абсолютная ошибка и самая низкая арифметическая ошибка. Опять же, при желании могу привести данные Гидрометцентра России. Что же касается Комплексного прогноза, то есть только табличка. Дело в том, что прогноз отдельно рассчитывается для каждого пункта и вывести его в какую-то сетку очень проблематично.


  1. Alexey2005
    21.11.2023 02:06
    +4

    С моей точки зрения, изобретение всех этих динамических моделей не пошло на пользу метеорологии. Потому что качество прогнозов выросло разве только для городов-миллионников, и то не сильно, зато вот для более отдалённой местности оно наоборот просело.

    Потому что раньше местные прогнозы составлялись местными же метеорологами, которые тут давно наблюдают и знают уже все особенности местного климата, а теперь простой скрипт тупо копипастит данные без малейших попыток хоть как-то соотнести их с реальностью.

    Например, я регулярно наблюдаю абсолютно невозможные ещё 30 лет назад "вылеты", когда в прогноз попадает откровенный бред (глюки модели). Например, когда для нашей местности ставят 80 или даже 90 мм осадков в сутки - живой метеоролог никогда не пропустил бы такое, а скрипту пофиг. Никто его ни с чем не сверяет, выдаёт что-то модель - и ладно.

    Или вот для нашей местности модель уже который год систематически завышает количество осадков. Особенно летом, потому что сильно переоценивает время жизни конвективных ячеек, зарождающихся в предгорьях Кавказа. Когда точность прогноза можно сильно улучшить, просто скорректировав на константу - это плохой, негодный прогноз. И то, что за столько лет эту коррекцию не добавили в скрипт сами метеорологи, говорит о том, что никакой обратной связи тут не предусмотрено вовсе. Модель сама по себе, погода сама по себе.


    1. JediPhilosopher
      21.11.2023 02:06

      По идее именно систематические ошибки и дожны лечить все эти Метеумы и похожие технологии. Которые берут выход обычной модели, сравнивают с реальной погодой, определяют расхождение и пытаются найти закономерности в этих расхождениях и подкрутить ими прогноз.


    1. WASD1
      21.11.2023 02:06
      +2

      С моей точки зрения, изобретение всех этих динамических моделей не пошло
      на пользу метеорологии. Потому что качество прогнозов выросло разве
      только для городов-миллионников, и то не сильно, зато вот для более
      отдалённой местности оно наоборот просело.

      Э... местные нейросетки и их прогнозы (вместе с головами метеорологов) переехали в университеты мегаполисов => местные прогнозы ухудшились.
      Гугл вернул нейросетевые прогнозы (но уже без голов метеорологов) => местные прогнозы улучшились

      :: sarcasm :: если что.




    1. fantast8 Автор
      21.11.2023 02:06
      +3

      Вы не правы. Развитие глобальных моделей вывело качество на абсолютно иной уровень. Ни один человек не смог превзойти модель на 3-10 сутки. Современные методы постобработки легко корректируют прогноз по метеостанциям и превосходят местных синоптиков. Например, РЭП и Комлексный прогноз обходят человеческие прогнозы даже на 24 часа. Вот данные за октябрь.


      1. vadimk91
        21.11.2023 02:06

        Я уж не помню когда, может лет 20 назад, по утрам у нас по радио перестали зачитывать местную метеосводку и прогноз. Народ возмутился, объясняли тем, что настал капитализм, за прогноз хотят денег и пользуйтесь тем, что Москва говорит. Вот тогда да, была жесть, центральные прогнозы "были далеки от народа" во всех смыслах.


  1. TaksShine
    21.11.2023 02:06

    В статье упомянуты региональные модели. Они лучше EMCF и нейросетевых моделей работают? Если да, то как их правильно искать, или может по каким регионам есть самые известные?


    1. JediPhilosopher
      21.11.2023 02:06

      Есть всякие профессиональные погодные сайты, например для тех кто летает или ходит под парусом. Там можно сравнить вывод разных моделей. И как раз есть всякие региональные модели. Их искать не надо, просто там в зависимости от точки на карте будут показаны и глобальные модели, и те локальные что есть на этом сайте.

      Парапланеристы чаще всего используют Windy (их два, windy.com и windy.app), windguru.cz.

      Вот для Питера мне больше всего нравился прогноз локальной европейской WRF8 с windy.app. Но теперь им блин денег за него не заплатить через плеймаркет. А в бесплатных версиях часто есть только GFS (потому что он бесплатный сам по себе), а детальные локальные модели за денежку.

      Региональные работают лучше потому, что учитывают детали рельефа. А у глобальных для этого шаг сетки слишком большой. Им ваше это озеро или гора просто невидимы, так как слишком маленькие, а они ведь влияют на погоду на вашей точке, причем зачастую сильнее чем иные глобальные эффекты.

      В горах например все эти прогнозы вообще очень плохо работают. Потому что тот же шаг сетки в 20-30 км может вмещать сразу несколько ущелий с совершенно разным микроклиматом, и не может учитывать всякие нюансы типа горных бризов, фенов и прочей горной аэрологии.


    1. fantast8 Автор
      21.11.2023 02:06

      Региональные модели позволяют экономить ресурсы, увеличивать разрешение сетки и прорабатывать местные особенности. Например, в России работает региональная модель COSMO, которая обладает сеткой 6.6 км и 2.2 км. На карте показан прогноз приземой температуры по модели COSMO 2.2 км. Она считается для Европейской части. Версия 6.6 считается для Сибири. Модель неплохая, но стартует с данных немецкой модели ICON, поэтому её нельзя назвать совсем отечественной.


  1. Al_Pollitruk
    21.11.2023 02:06
    +2

    А можно попросить автора сделать в будущих публикациях некую сводную таблицу, в каких макрорегионах РФ на каких сервисах лучше смотреть прогнозы? Так в СПб достаточно хорошо работает Яндекс (у них своя видимо модель), в Мурманске бывает полезно посмотреть норвежские прогнозы. А что использует Gismeteo (по Беларуси были более точные прогнозы)?


    1. fantast8 Автор
      21.11.2023 02:06
      +2

      Сразу скажу, что Gismeteo является худшим ресурсом для прогнозов. Оценки есть в статье выше. По Беларуси рассчитывается комплексный прогноз. Лучше Вы не найдёте. https://method.meteorf.ru/ansambl/complex.html


  1. alex-open-plc
    21.11.2023 02:06

    Метеорологи как и саперы, ошибаются только один раз. Но, каждый день.


    1. fantast8 Автор
      21.11.2023 02:06
      +1

      Очень часто путают синоптиков и метеорологов. Погоду прогнозируют синоптики. Метеорологи за ней наблюдают. Точность человеческих прогнозов в России на одни сутки составляет 96%, что чуть ниже, чем автоматизированные прогнозы по методике РЭП и Комплекс. На каждые последующие сутки точность в среднем падает на 2-3%.


  1. iKBAHT
    21.11.2023 02:06

    В 2005 году на 10-ть суток точность прогноза была 40%, а сейчас 50%.

    В Калининграде точность прогноза 50% на ТЕКУЩИЙ день. Я так понимаю, что эти цифры средние по планете?


    1. fantast8 Автор
      21.11.2023 02:06
      +2

      Давайте посмотрим данные за октябрь. Зачем фантазировать) В Калининграде местные синоптики прогнозировали температуру на одни сутки с точностью 97-100%. На ночь 97%, ошибка 1.2 градуса. Днём 100%, ошибка 0.9 градуса. Точность по методике РЭП (сайт Гидрометцентра России) 94-100%.


      1. iKBAHT
        21.11.2023 02:06

        По температуре все правильно, но по осадкам 50% на текущий день. В статье идет речь только про прогнозирование температуры? Нигде не указанно, что именно прогнозируется. Для потребителей прогноза важней всего именно осадки, температуру можно и из окна понять.


        1. fantast8 Автор
          21.11.2023 02:06

          По осадкам на сутки гидродинамические модели могут гарантировать 75-86% в зависимости от времени года. Цифры с не с потолка, есть данные Гидрометцентра России по разным моделями. Самый базовый параметр прогноза у моделей - это барическое поле, поле давления. Его оно прогнозируется корректно, то и все остальные параметры будут точными. Поэтому во многих тестах оценивается в первую очередь прогноз барического поля, а уже затем температуры, осадков и прочего.


          1. iKBAHT
            21.11.2023 02:06

            Спасибо


  1. arheops
    21.11.2023 02:06
    +1

    Тоесть по многим областям мы возвращаемся к предсказаниям вида "бабка сказала", но теперь вместо бабки - модель.

    Никто не знает почему, точность в конкретной точке непрогнозируема, но в среднем - лучше.


    1. larasage
      21.11.2023 02:06

      Я так понимаю, что не создали ещё нейросеть, которая могла бы из данных нейросеток вылавливать что именно определяет выдачу нейросети (в понимаемом человеком виде) :)


      1. arheops
        21.11.2023 02:06

        Эта задача на несколько порядков сложнее задачи ИИ.

        Если вообще возможно решение.


    1. vadimk91
      21.11.2023 02:06

      Ну так да, используем накопленный опыт :) Раньше дед выйдет вечером на берег, посмотрит на красный закат и скажет "завтра будет ветер, в озеро не пойдем".


  1. klounader
    21.11.2023 02:06

    У ECMWF могли бы уйти десятки лет упорной и кропотливой работы, чтобы вывести точность за пределы 50%.

    Сталин спросил у синоптиков, какой у них процент точности прогнозов.

    – Сорок процентов, товарищ Сталин.

    – А вы говорите наоборот, и тогда у вас будет шестьдесят процентов.


  1. den_admin
    21.11.2023 02:06

    А где-то можно посмотреть фактическую погоду, а не прогноз?


    1. fantast8 Автор
      21.11.2023 02:06
      +1

      Сводки фактической погоды есть на сайте Гидрометцентра России. Кроме того, сводки метеостанций публикует сайт rp5. Есть сайт https://www.weatherobs.com/ где сводки можно увидеть на карте.


  1. Real3L0
    21.11.2023 02:06

    А Яндекс разве не по такой же методике делает расчёты: Технология точного прогноза погоды Meteum 2.0 (yandex.ru) ?

    И что у Яндекса, что у остальных - даже рядом не видел "погрешность в 3 градуса". А уж то, что за окном идёт дождь, а прогноз говорит "на улице ясно" - это постоянно.

    Так утверждаю, потому что два раза в год планирую переобувку машины: смотрю прогноз на пять дней, в течение нескольких дней. Если при каждом просмотре температура все дни всегда выше/ниже +5 все пять дней - записываюсь. И постоянно: сегодня смотрим на после завтра +10, завтра смотрим на завтра +5.