Подключаем WeatherNext 2 к движку
Мы начали то, что с большим отрывом является самым масштабным улучшением точности прогнозов, за которое мы когда-либо брались: интеграции WeatherNext 2 от Google DeepMind в вероятностное ядро StormBot. Если мы реализуем это чисто, это изменит базовое качество каждого преимущества, которое отмечает движок, — и, следовательно, ожидаемую отдачу каждого ордера, который мы маршрутизируем.
В остальной части этой заметки рассказывается, что такое WeatherNext 2 на самом деле, в чём он превосходит модель NOAA GFS, на которую мы полагаемся сегодня, почему интеграция сложнее, чем кажется, и как доступ будет распределяться по уровням в зависимости от объёма торгов на платформе после запуска.
Что такое WeatherNext 2?
WeatherNext 2 — самая продвинутая прогностическая модель, выпущенная Google DeepMind. Представленная в конце 2025 года и уже работающая в Google Search, Gemini, Pixel Weather и Google Maps, она представляет собой поколенческий скачок в глобальном прогнозировании погоды.
Вместо решения физических уравнений, описывающих атмосферу — подход, который NOAA GFS, модель ECMWF и все традиционные системы использовали десятилетиями — WeatherNext 2 учит поведение атмосферы непосредственно на десятилетиях исторических данных. Он построен на совершенно новой архитектуре под названием Функциональная генеративная сеть (FGN), который вводит контролируемый шум непосредственно в модель, так что каждый создаваемый прогноз остаётся физически согласованным и внутренне когерентным по переменным.
8× быстрее генерация
Полный ансамблевый прогноз занимает менее минуты на одном TPU. Физическим моделям нужны часы на суперкомпьютере для того же результата.
99,9 % переменных улучшены
Превосходит предыдущий state-of-the-art по 99,9 % переменных (температура, ветер, влажность, давление, осадки) и на всех сроках от 0 до 15 дней.
1-часовое разрешение
Почасовые прогнозы обновляются четыре раза в день — значительно точнее, чем нативные 3–6 часов у GFS для тех горизонтов, на которых мы торгуем.
Сотни сценариев
Менее чем за минуту генерирует вероятностный ансамбль из сотен правдоподобных вариантов будущего, давая нам настоящее распределение — а не единственное детерминированное предположение.
Почему он точнее, чем NOAA GFS
Global Forecast System NOAA — феноменальная инженерия, но был разработан до эпохи глубокого обучения, и пределы моделей на основе физики очевидны уже много лет. Есть причина, по которой ECMWF исторически опережает GFS примерно на полный день прогнозного навыка, и почему почти каждый крупный поставщик погоды тихо начал накладывать ИИ поверх своего традиционного стека.
Вот где WeatherNext 2 опережает GFS — именно в тех краткосрочных и среднесрочных прогнозах температуры, которые движут погодными контрактами Polymarket:
- Изученные атмосферные паттерны vs. решённые уравнения — GFS аппроксимирует атмосферу, дискретизируя её в сетку и решая Навье-Стокса на каждом временном шаге. Эти приближения накапливаются со временем. WeatherNext 2 выучил полное нелинейное поведение атмосферы из данных реанализа ERA5, поэтому не накапливает тот же класс численной ошибки.
- Нативный вероятностный вывод — GFS даёт один прогноз за прогон. Чтобы получить распределение, нужен GEFS (ансамбль), что добавляет стоимость и задержку. WeatherNext 2 нативно выдаёт полное распределение, и мы видим реальную вероятность того, что город достигнет 14°C, а не просто точечную оценку, которую нам приходится оборачивать байесовски самим.
- Более высокое эффективное разрешение — WeatherNext 2 создаёт почасовые глобальные прогнозы. GFS работает с горизонтальным разрешением 13 км и 3-часовым выводом для нашего торгового диапазона. Для контрактов на дневной максимум и дневной минимум по конкретным городам эта дополнительная временная детализация — настоящее преимущество.
- Лучше на хвостах — бенчмарки DeepMind показывают наибольшие выигрыши на событиях с низкой вероятностью и высоким воздействием: похолоданиях, тепловых куполах, штормах. Это именно те рынки, где живут неверно оценённые хвосты и откуда приходят наши крупнейшие сделки.
- Физически когерентные ансамбли — архитектура FGN означает, что каждый сценарий в ансамбле внутренне согласован (ветреный сценарий также имеет соответствующий градиент давления). Именно это делает вероятности пригодными для ценообразования.
Для горизонтов 0-3 дня, составляющих основную часть погодных рынков Polymarket, независимые оценки ставят современные ИИ-модели на тот же уровень — и часто впереди — флагманского IFS от ECMWF, который сам существенно впереди GFS. Приблизительно: несколько десятых градуса RMSE по дневному максимуму температуры на отметке 48 часов и заметно более точная калибровка на редких событиях.
Почему это меняет результат сделок
Всё преимущество StormBot исходит из одного механического шага: оценки истинной вероятности температурного диапазона точнее, чем её оценивает рынок Polymarket. Всё, что следует дальше — решение Claude YES/NO, определение размера по Келли, логика выхода, трейлинг-стопы — питается от этой оценки вероятности.
Сегодня мы объединяем GFS, ECMWF, UKMO и NWS, байесовски смешиваем их с исторической климатологией NCEI и применяем нормальную CDF к распределению ошибки прогноза, чтобы получить вероятность. Это работает. Но фундаментально ограничено точностью базовых моделей.
Замена этой оценки вероятности на WeatherNext 2 в качестве основного сигнала даёт очень конкретные эффекты:
- Более чёткое обнаружение перевеса. Полградуса улучшения RMSE прогноза напрямую переводится в 1-3% больше обнаруживаемого edge на пограничных рынках, которые сейчас отфильтровываются нашим порогом 2%. Больше сигналов достигает Claude.
- Лучшая калибровка. Когда мы говорим «78 % вероятность YES», это должно действительно сходиться к 78 % на большой выборке. Нативный вероятностный вывод WeatherNext 2 откалиброван заметно лучше, чем всё, что мы можем синтезировать из детерминированных моделей.
- Меньше катастрофических хвостовых сделок. Более сильная работа модели на редких событиях означает, что мы реже неверно оцениваем fat tails — исторически нашу крупнейшую категорию неожиданных убытков.
- Более быстрый цикл работы модели. Наш текущий цикл получения прогнозов ограничен задержкой бесплатных погодных API с лимитами на частоту запросов. Запуск WeatherNext 2 через Vertex AI Google Cloud означает, что мы можем обновлять прогнозы по своему расписанию, а не по их.
Почему это сложная задача
Мы хотим быть откровенными: это самая сложная инженерная работа, за которую мы взялись со времён миграции инфраструктуры v2. "Подключить новую модель" никогда не бывает так просто, как звучит, а у WeatherNext 2, в частности, есть ряд острых углов.
engine/edge.js и заново настроить каждый порог, который использует Claude.Ожидаемый прирост точности
На основе опубликованных бенчмарков DeepMind и нашего собственного внутреннего моделирования того, как ошибка прогноза распространяется через наш калькулятор преимущества, вот куда мы ожидаем сдвига производительности StormBot после внедрения интеграции:
Доступ: по объёму для лояльных пользователей
Нам нужно быть честными насчёт экономики здесь. Инференс WeatherNext 2 через Vertex AI не бесплатен, а работа над инфраструктурой представляет собой значительные инженерные вложения. Мы не можем дать его всем в первый же день — и, честно говоря, не хотим. Пользователи, которые на деле превратили StormBot в то, чем он является сегодня, должны быть теми, кто получит его первыми.
Когда выйдет WeatherNext 2, доступ будет зависит от объёма торгов на платформе. Ваш накопительный объём торгов — каждый доллар pUSD, который вы разместили через StormBot на рынки Polymarket, — становится валютой, открывающей обновлённый движок. Чем больше вы торговали, тем раньше и глубже ваш доступ.
Как будут работать уровни объёма
Окончательные пороги уровней будут объявлены ближе к запуску, но структура уже зафиксирована:
- Tier 1 — основатели: группа с наивысшим совокупным объёмом получает первую волну доступа к WeatherNext 2 во время закрытой альфы. Полный вывод ансамбля, наивысшая частота обновления, прямой канал обратной связи с инженерной командой.
- Tier 2 — продвинутые пользователи: вторая волна во время беты. Полный сигнал WeatherNext 2 с немного сниженной частотой обновления.
- Tier 3 — активные трейдеры: общий выпуск с WeatherNext 2 как дополнением к существующему стеку GFS/ECMWF/UKMO/NWS.
- Ниже порога: продолжается на текущем мульти-модельном стеке, который остаётся полностью поддерживаемым и улучшается независимо.
Ваш торговый объём отслеживается автоматически — каждая сделка, которую бот совершает от вашего имени, учитывается. Вам не нужно делать ничего особенного. Чем больше вы используете платформу, тем выше ваш уровень.
Небольшое замечание о справедливости: уровни объёма рассчитываются на основе вашей торговой активности на платформе, а не размера вашего кошелька. Пользователь с меньшим банкроллом, но позволяющий боту торговать стабильно, поднимется по уровням быстрее, чем тот, кто вносит крупный баланс и оставляет его без дела. Это сделано намеренно — мы хотим вознаграждать тех, кто действительно использует StormBot так, как он задуман.
График
Никаких обещаний по точным датам — это серьёзная инженерная работа, и мы не собираемся торопить её в продакшен. Но вот честная дорожная карта:
- Сейчас: Учётная запись Google Cloud подготовлена, запрошен ранний доступ к Vertex AI, прототип shadow-mode строится на исторических данных.
- Ближайшие недели: Рефакторинг edge-движка для работы с вероятностными ансамблями. Параллельное логирование рядом с текущим движком.
- Следующие недели: Shadow run в продакшене — прогнозы WeatherNext 2 логируются для каждого рынка, сравниваются с фактическими разрешениями, отчёты о калибровке публикуются здесь.
- После прохождения бенчмарков: Закрытая альфа для пользователей Tier 1. Обратная связь с инженерной командой. Финальная настройка.
- После альфы: Поэтапное развёртывание через Tier 2, затем Tier 3.
Что вы можете сделать прямо сейчас
Ваш объём торгов начинает учитываться сегодня. Каждая сделка, которую StormBot совершает от вашего имени с этого момента, засчитывается в ваш уровень WeatherNext 2 на запуске. Убедитесь, что ваш бот работает, банкролл настроен, а кошелёк подключён. Мы опубликуем точные пороги объёма в ближайшие недели — но пользователи, которые рано поднимутся в таблице лидеров, станут теми, кто первым шагнёт в обновлённый движок.