Главная Рейтинг Запустить приложение

Подключаем WeatherNext 2 к движку

Мы начали то, что с большим отрывом является самым масштабным улучшением точности прогнозов, за которое мы когда-либо брались: интеграции WeatherNext 2 от Google DeepMind в вероятностное ядро StormBot. Если мы реализуем это чисто, это изменит базовое качество каждого преимущества, которое отмечает движок, — и, следовательно, ожидаемую отдачу каждого ордера, который мы маршрутизируем.

В остальной части этой заметки рассказывается, что такое WeatherNext 2 на самом деле, в чём он превосходит модель NOAA GFS, на которую мы полагаемся сегодня, почему интеграция сложнее, чем кажется, и как доступ будет распределяться по уровням в зависимости от объёма торгов на платформе после запуска.

Что такое WeatherNext 2?

WeatherNext 2 — самая продвинутая прогностическая модель, выпущенная Google DeepMind. Представленная в конце 2025 года и уже работающая в Google Search, Gemini, Pixel Weather и Google Maps, она представляет собой поколенческий скачок в глобальном прогнозировании погоды.

Вместо решения физических уравнений, описывающих атмосферу — подход, который NOAA GFS, модель ECMWF и все традиционные системы использовали десятилетиями — WeatherNext 2 учит поведение атмосферы непосредственно на десятилетиях исторических данных. Он построен на совершенно новой архитектуре под названием Функциональная генеративная сеть (FGN), который вводит контролируемый шум непосредственно в модель, так что каждый создаваемый прогноз остаётся физически согласованным и внутренне когерентным по переменным.

8× быстрее генерация

Полный ансамблевый прогноз занимает менее минуты на одном TPU. Физическим моделям нужны часы на суперкомпьютере для того же результата.

99,9 % переменных улучшены

Превосходит предыдущий state-of-the-art по 99,9 % переменных (температура, ветер, влажность, давление, осадки) и на всех сроках от 0 до 15 дней.

1-часовое разрешение

Почасовые прогнозы обновляются четыре раза в день — значительно точнее, чем нативные 3–6 часов у GFS для тех горизонтов, на которых мы торгуем.

Сотни сценариев

Менее чем за минуту генерирует вероятностный ансамбль из сотен правдоподобных вариантов будущего, давая нам настоящее распределение — а не единственное детерминированное предположение.

Почему он точнее, чем NOAA GFS

Global Forecast System NOAA — феноменальная инженерия, но был разработан до эпохи глубокого обучения, и пределы моделей на основе физики очевидны уже много лет. Есть причина, по которой ECMWF исторически опережает GFS примерно на полный день прогнозного навыка, и почему почти каждый крупный поставщик погоды тихо начал накладывать ИИ поверх своего традиционного стека.

Вот где WeatherNext 2 опережает GFS — именно в тех краткосрочных и среднесрочных прогнозах температуры, которые движут погодными контрактами Polymarket:

  • Изученные атмосферные паттерны vs. решённые уравнения — GFS аппроксимирует атмосферу, дискретизируя её в сетку и решая Навье-Стокса на каждом временном шаге. Эти приближения накапливаются со временем. WeatherNext 2 выучил полное нелинейное поведение атмосферы из данных реанализа ERA5, поэтому не накапливает тот же класс численной ошибки.
  • Нативный вероятностный вывод — GFS даёт один прогноз за прогон. Чтобы получить распределение, нужен GEFS (ансамбль), что добавляет стоимость и задержку. WeatherNext 2 нативно выдаёт полное распределение, и мы видим реальную вероятность того, что город достигнет 14°C, а не просто точечную оценку, которую нам приходится оборачивать байесовски самим.
  • Более высокое эффективное разрешение — WeatherNext 2 создаёт почасовые глобальные прогнозы. GFS работает с горизонтальным разрешением 13 км и 3-часовым выводом для нашего торгового диапазона. Для контрактов на дневной максимум и дневной минимум по конкретным городам эта дополнительная временная детализация — настоящее преимущество.
  • Лучше на хвостах — бенчмарки DeepMind показывают наибольшие выигрыши на событиях с низкой вероятностью и высоким воздействием: похолоданиях, тепловых куполах, штормах. Это именно те рынки, где живут неверно оценённые хвосты и откуда приходят наши крупнейшие сделки.
  • Физически когерентные ансамбли — архитектура FGN означает, что каждый сценарий в ансамбле внутренне согласован (ветреный сценарий также имеет соответствующий градиент давления). Именно это делает вероятности пригодными для ценообразования.

Для горизонтов 0-3 дня, составляющих основную часть погодных рынков Polymarket, независимые оценки ставят современные ИИ-модели на тот же уровень — и часто впереди — флагманского IFS от ECMWF, который сам существенно впереди GFS. Приблизительно: несколько десятых градуса RMSE по дневному максимуму температуры на отметке 48 часов и заметно более точная калибровка на редких событиях.

Почему это меняет результат сделок

Всё преимущество StormBot исходит из одного механического шага: оценки истинной вероятности температурного диапазона точнее, чем её оценивает рынок Polymarket. Всё, что следует дальше — решение Claude YES/NO, определение размера по Келли, логика выхода, трейлинг-стопы — питается от этой оценки вероятности.

Сегодня мы объединяем GFS, ECMWF, UKMO и NWS, байесовски смешиваем их с исторической климатологией NCEI и применяем нормальную CDF к распределению ошибки прогноза, чтобы получить вероятность. Это работает. Но фундаментально ограничено точностью базовых моделей.

Замена этой оценки вероятности на WeatherNext 2 в качестве основного сигнала даёт очень конкретные эффекты:

  • Более чёткое обнаружение перевеса. Полградуса улучшения RMSE прогноза напрямую переводится в 1-3% больше обнаруживаемого edge на пограничных рынках, которые сейчас отфильтровываются нашим порогом 2%. Больше сигналов достигает Claude.
  • Лучшая калибровка. Когда мы говорим «78 % вероятность YES», это должно действительно сходиться к 78 % на большой выборке. Нативный вероятностный вывод WeatherNext 2 откалиброван заметно лучше, чем всё, что мы можем синтезировать из детерминированных моделей.
  • Меньше катастрофических хвостовых сделок. Более сильная работа модели на редких событиях означает, что мы реже неверно оцениваем fat tails — исторически нашу крупнейшую категорию неожиданных убытков.
  • Более быстрый цикл работы модели. Наш текущий цикл получения прогнозов ограничен задержкой бесплатных погодных API с лимитами на частоту запросов. Запуск WeatherNext 2 через Vertex AI Google Cloud означает, что мы можем обновлять прогнозы по своему расписанию, а не по их.

Почему это сложная задача

Мы хотим быть откровенными: это самая сложная инженерная работа, за которую мы взялись со времён миграции инфраструктуры v2. "Подключить новую модель" никогда не бывает так просто, как звучит, а у WeatherNext 2, в частности, есть ряд острых углов.

1
Доступ к данным и инфраструктура
Прогнозы WeatherNext 2 поставляются через Earth Engine, BigQuery и Vertex AI. Ничто из этого не является прямой заменой бесплатным HTTP-эндпоинтам, которые мы используем. Нужны auth, управление квотами, контроль затрат и слой кэширования, амортизирующий платные inference-вызовы по нашим 97+ активным комбинациям город/дата.
2
Интеграция вероятностного вывода
Наш калькулятор перевеса был спроектирован вокруг единственного детерминированного точечного прогноза плюс гауссовой модели ошибки. WeatherNext 2 даёт нам полный ансамбль из сотен сценариев на город. Перепроводка edge-движка для работы с настоящим эмпирическим распределением (а не с подделкой) требует переписывания ядра engine/edge.js и заново настроить каждый порог, который использует Claude.
3
Интерполяция сетки до точек городов
WeatherNext 2 выводит глобальную сетку. Погодные контракты Polymarket резолвятся на конкретных именованных метеостанциях (например, LaGuardia для Нью-Йорка, Heathrow для Лондона). Нужна точная билинейная или nearest-station интерполяция из нативной сетки модели в точную станцию резолюции — и затем downscaling для локальных микроклиматических эффектов, где это уместно.
4
Стоимость прогноза
Каждая комбинация город/дата, которую мы мониторим, становится платным вызовом инференса Vertex AI. При ~1 975 активных погодных рынков в ~97 уникальных комбинациях наивная реализация быстро спалила бы бюджет. Мы строим многоуровневую стратегию обновления: рынки с высокой уверенностью получают частые обновления, города с малым объёмом — более медленные циклы.
5
Обратная совместимость
Мы не выкидываем GFS/ECMWF/UKMO/NWS. Финальная архитектура использует WeatherNext 2 как основной сигнал, а традиционные модели — как проверку на разумность. Если WeatherNext 2 резко расходится с физическими моделями, само это расхождение становится фичей, о которой может рассуждать Claude — а не поводом слепо доверять любой стороне.
6
Валидация вне выборки
Перед тем как переключиться, мы должны неделями запускать WeatherNext 2 в shadow-режиме параллельно с живым ботом — логируя, что бы он предсказал для каждого рынка, а затем сравнивая с фактическим результатом. Модель, которая прекрасно проходит бенчмарки на реанализе ERA5, всё равно должна заработать своё место в продакшен-цикле торговли с реальными деньгами.

Ожидаемый прирост точности

На основе опубликованных бенчмарков DeepMind и нашего собственного внутреннего моделирования того, как ошибка прогноза распространяется через наш калькулятор преимущества, вот куда мы ожидаем сдвига производительности StormBot после внедрения интеграции:

RMSE температуры (горизонт 48 ч)
−28%
Ожидаемое снижение ошибки прогноза на отметке 2 дня — горизонт, на котором разрешается большинство наших сделок.
Калибровка вероятностей (Brier Score)
+18%
Лучше откалиброванные вероятности означают, что уровни уверенности Claude действительно соответствуют реальности, что напрямую улучшает Kelly-сайзинг.
Точность по экстремальным событиям (сильный холод/жара)
+40%
Самые большие выигрыши приходятся на редкие события — именно там, где рынки сильнее всего ошибаются в цене и где живут наши крупнейшие победы.
Обнаруживаемый edge на сканирование
+35%
Более точные прогнозы выталкивают больше рынков выше нашего порога edge 2%, давая Claude больше высококачественных сигналов для оценки.

Доступ: по объёму для лояльных пользователей

Нам нужно быть честными насчёт экономики здесь. Инференс WeatherNext 2 через Vertex AI не бесплатен, а работа над инфраструктурой представляет собой значительные инженерные вложения. Мы не можем дать его всем в первый же день — и, честно говоря, не хотим. Пользователи, которые на деле превратили StormBot в то, чем он является сегодня, должны быть теми, кто получит его первыми.

Когда выйдет WeatherNext 2, доступ будет зависит от объёма торгов на платформе. Ваш накопительный объём торгов — каждый доллар pUSD, который вы разместили через StormBot на рынки Polymarket, — становится валютой, открывающей обновлённый движок. Чем больше вы торговали, тем раньше и глубже ваш доступ.

Как будут работать уровни объёма

Окончательные пороги уровней будут объявлены ближе к запуску, но структура уже зафиксирована:

  • Tier 1 — основатели: группа с наивысшим совокупным объёмом получает первую волну доступа к WeatherNext 2 во время закрытой альфы. Полный вывод ансамбля, наивысшая частота обновления, прямой канал обратной связи с инженерной командой.
  • Tier 2 — продвинутые пользователи: вторая волна во время беты. Полный сигнал WeatherNext 2 с немного сниженной частотой обновления.
  • Tier 3 — активные трейдеры: общий выпуск с WeatherNext 2 как дополнением к существующему стеку GFS/ECMWF/UKMO/NWS.
  • Ниже порога: продолжается на текущем мульти-модельном стеке, который остаётся полностью поддерживаемым и улучшается независимо.

Ваш торговый объём отслеживается автоматически — каждая сделка, которую бот совершает от вашего имени, учитывается. Вам не нужно делать ничего особенного. Чем больше вы используете платформу, тем выше ваш уровень.

Небольшое замечание о справедливости: уровни объёма рассчитываются на основе вашей торговой активности на платформе, а не размера вашего кошелька. Пользователь с меньшим банкроллом, но позволяющий боту торговать стабильно, поднимется по уровням быстрее, чем тот, кто вносит крупный баланс и оставляет его без дела. Это сделано намеренно — мы хотим вознаграждать тех, кто действительно использует StormBot так, как он задуман.

График

Никаких обещаний по точным датам — это серьёзная инженерная работа, и мы не собираемся торопить её в продакшен. Но вот честная дорожная карта:

  • Сейчас: Учётная запись Google Cloud подготовлена, запрошен ранний доступ к Vertex AI, прототип shadow-mode строится на исторических данных.
  • Ближайшие недели: Рефакторинг edge-движка для работы с вероятностными ансамблями. Параллельное логирование рядом с текущим движком.
  • Следующие недели: Shadow run в продакшене — прогнозы WeatherNext 2 логируются для каждого рынка, сравниваются с фактическими разрешениями, отчёты о калибровке публикуются здесь.
  • После прохождения бенчмарков: Закрытая альфа для пользователей Tier 1. Обратная связь с инженерной командой. Финальная настройка.
  • После альфы: Поэтапное развёртывание через Tier 2, затем Tier 3.

Что вы можете сделать прямо сейчас

Ваш объём торгов начинает учитываться сегодня. Каждая сделка, которую StormBot совершает от вашего имени с этого момента, засчитывается в ваш уровень WeatherNext 2 на запуске. Убедитесь, что ваш бот работает, банкролл настроен, а кошелёк подключён. Мы опубликуем точные пороги объёма в ближайшие недели — но пользователи, которые рано поднимутся в таблице лидеров, станут теми, кто первым шагнёт в обновлённый движок.

Читать далее

Два новых способа играть с небом: Storm Spin и Storm Bet уже доступны

Читать статью

Гонконгская фиксация: мы перестали прогнозировать город и начали его считывать

Читать статью

StormBot в цифрах: 9 592 трейдера, $2.87M прибыли участников и точная стоимость работы

Читать статью
Все статьи