Підключення WeatherNext 2 до рушія
Ми розпочали те, що з великим відривом є найбільшим оновленням точності прогнозу, яке ми коли-небудь намагалися зробити: вбудовування WeatherNext 2 від Google DeepMind у ядро ймовірностей StormBot. Якщо ми реалізуємо це чисто, це змінить базову якість кожної переваги, яку позначає рушій — а отже, очікувану виплату кожного ордера, який ми маршрутизуємо.
Решта цієї нотатки охоплює те, чим насправді є WeatherNext 2, де вона випереджає модель NOAA GFS, на яку ми покладаємося сьогодні, чому інтеграція складніша, ніж здається, і як доступ буде розподілений за рівнями залежно від обсягу торгів на платформі, щойно ми запустимося.
Що таке WeatherNext 2?
WeatherNext 2 — найдосконаліша модель прогнозу, яку випустив Google DeepMind. Представлена наприкінці 2025 і вже працює в Google Search, Gemini, Pixel Weather та Google Maps — це поколіннєвий стрибок у глобальному прогнозуванні погоди.
Замість того, щоб розв'язувати фізичні рівняння, що описують атмосферу — підхід, який NOAA GFS, модель ECMWF та всі традиційні системи використовували десятиліттями — WeatherNext 2 вчить поведінку атмосфери безпосередньо з десятиліть історичних даних. Він побудований на абсолютно новій архітектурі під назвою Функціональна генеративна мережа (FGN), який інжектує контрольований шум безпосередньо в модель, щоб кожен створюваний прогноз залишався фізично узгодженим і внутрішньо когерентним між змінними.
У 8× швидша генерація
Повний ансамблевий прогноз займає менше хвилини на одному TPU. Фізичним моделям потрібні години на суперкомп'ютері для такого ж результату.
99,9% змінних покращено
Перевершує попередній state-of-the-art за 99,9% змінних (температура, вітер, вологість, тиск, опади) і на всіх горизонтах від 0 до 15 днів.
1-годинна роздільність
Погодинні прогнози оновлюються чотири рази на день — значно точніше за нативну роздільну здатність 3-6 годин у GFS для горизонтів, на яких ми торгуємо.
Сотні сценаріїв
Менш ніж за хвилину генерує імовірнісний ансамбль із сотень правдоподібних варіантів майбутнього, даючи нам справжній розподіл — а не одне детерміністичне припущення.
Чому він точніший за NOAA GFS
Global Forecast System NOAA — феноменальна інженерія, але був розроблений до епохи глибокого навчання, і обмеження моделей на основі фізики очевидні вже багато років. Є причина, чому ECMWF історично випереджає GFS приблизно на цілий день прогнозної навички, і чому майже кожен великий постачальник погоди тихо почав накладати ШІ поверх свого традиційного стеку.
Ось де WeatherNext 2 випереджає GFS — саме в тих короткострокових і середньострокових прогнозах температури, які рухають погодні контракти Polymarket:
- Вивчені атмосферні патерни проти розв'язаних рівнянь — GFS апроксимує атмосферу, дискретизуючи її в сітку і розв'язуючи Нав'є-Стокса на кожному часовому кроці. Ці наближення накопичуються з часом. WeatherNext 2 вивчив повну нелінійну поведінку атмосфери з даних реаналізу ERA5, тому не накопичує той же клас числової помилки.
- Нативний імовірнісний вивід — GFS дає один прогноз за запуск. Щоб отримати розподіл, потрібен GEFS (ансамбль), що додає вартість і затримку. WeatherNext 2 видає повний розподіл нативно, тож ми бачимо реальну ймовірність того, що місто досягне 14°C, а не точкову оцінку, яку ми мусимо самі баєсівськи обгортати.
- Вища ефективна роздільність — WeatherNext 2 створює погодинні глобальні прогнози. GFS працює з горизонтальною роздільною здатністю 13 км і 3-годинним виводом для нашого торгового діапазону. Для контрактів на денний максимум і денний мінімум по конкретних містах ця додаткова часова деталізація — справжня перевага.
- Краще на хвостах — бенчмарки DeepMind показують найбільші виграші на подіях з низькою ймовірністю та високим впливом: похолодання, теплові куполи, шторми. Це саме ті ринки, де живуть неправильно оцінені хвости і звідки приходять наші найбільші угоди.
- Фізично узгоджені ансамблі — архітектура FGN означає, що кожен сценарій в ансамблі внутрішньо узгоджений (вітряний сценарій також має відповідний градієнт тиску). Саме це робить ймовірності придатними для ціноутворення.
Для горизонтів 0-3 дні, що складають більшість погодних ринків Polymarket, незалежні оцінки ставлять сучасні ШІ-моделі на той самий рівень — і часто попереду — флагманського IFS від ECMWF, який сам значно випереджає GFS. Грубо кажучи: кілька десятих градуса RMSE по добовому максимуму температури на позначці 48 годин і помітно щільніша калібровка на рідкісних подіях.
Чому це змінює результат угод
Уся перевага StormBot походить від одного механічного кроку: оцінки справжньої ймовірності температурного діапазону точніше, ніж її оцінює ринок Polymarket. Усе подальше — рішення YES/NO від Claude, сайзинг за Келлі, логіка виходу, трейлінг-стопи — усе живиться від цієї оцінки ймовірності.
Сьогодні ми поєднуємо GFS, ECMWF, UKMO та NWS, баєсівськи змішуємо їх із історичною кліматологією NCEI і застосовуємо нормальну CDF над розподілом помилки прогнозу, щоб отримати ймовірність. Це працює. Але фундаментально обмежено точністю базових моделей.
Заміна цієї оцінки ймовірності на WeatherNext 2 як основний сигнал має дуже конкретні ефекти:
- Чіткіше виявлення переваги. Поліпшення прогнозного RMSE на півградуса безпосередньо перетворюється на 1-3% більше виявлюваного edge на прикордонних ринках, які наразі відфільтровуються нашим порогом 2%. Більше сигналів досягає Claude.
- Краще калібрування. Коли ми кажемо «78% імовірність YES», це має дійсно сходитися до 78% на великій вибірці. Нативний імовірнісний вивід WeatherNext 2 калібрований значно краще, ніж усе, що ми можемо синтезувати з детермінованих моделей.
- Менше катастрофічних хвостових угод. Сильніша робота моделі на рідкісних подіях означає, що ми рідше неправильно оцінюємо fat tails — історично нашу найбільшу категорію несподіваних збитків.
- Швидший цикл роботи моделі. Наш поточний цикл отримання прогнозів обмежений затримкою безкоштовних погодних API з лімітами на частоту запитів. Запуск WeatherNext 2 через Vertex AI Google Cloud означає, що ми можемо оновлювати прогнози за власним графіком, а не їхнім.
Чому це складна задача
Ми хочемо бути відвертими: це найскладніша інженерна робота, за яку ми взялися з часів міграції інфраструктури v2. "Підключити нову модель" ніколи не буває так просто, як звучить, а у WeatherNext 2 зокрема є низка гострих кутів.
engine/edge.js і повторно налаштувати кожен поріг, який використовує Claude.Очікуване підвищення точності
На основі опублікованих бенчмарків DeepMind та нашого власного внутрішнього моделювання того, як похибка прогнозу поширюється через наш калькулятор переваги, ось де ми очікуємо зміну продуктивності StormBot, щойно інтеграція запрацює:
Доступ: за обсягом для лояльних користувачів
Ми маємо бути чесними щодо економіки тут. Інференс WeatherNext 2 через Vertex AI не є безкоштовним, а робота над інфраструктурою становить значні інженерні інвестиції. Ми не можемо надати це всім у перший же день — і, чесно кажучи, ми цього не хочемо. Користувачі, які насправді зробили StormBot тим, чим він є сьогодні, повинні отримати це першими.
Коли вийде WeatherNext 2, доступ буде обмежено обсягом торгів на платформі. Ваш сукупний торговий обсяг — кожен долар pUSD, який ви розгорнули через StormBot на ринки Polymarket — стає валютою, що розблоковує оновлений рушій. Чим більше ви торгували, тим раніший і глибший ваш доступ.
Як працюватимуть рівні обсягу
Остаточні пороги рівнів буде оголошено ближче до запуску, але структура вже зафіксована:
- Tier 1 — засновники: група з найвищим сукупним обсягом отримує першу хвилю доступу до WeatherNext 2 під час закритої альфи. Повний вихід ансамблю, найвища частота оновлення, прямий канал зворотного зв'язку з інженерною командою.
- Tier 2 — досвідчені користувачі: друга хвиля під час бети. Повний сигнал WeatherNext 2 із дещо зниженою частотою оновлення.
- Tier 3 — активні трейдери: загальне розгортання з WeatherNext 2 як доповненням до наявного стеку GFS/ECMWF/UKMO/NWS.
- Нижче порогу: продовжується на поточному мультимодельному стеку, який залишається повністю підтримуваним і сам незалежно покращується.
Ваш торговий обсяг відстежується автоматично — кожна угода, яку бот здійснює від вашого імені, рахується. Вам не потрібно робити нічого особливого. Чим більше ви використовуєте платформу, тим вищий ваш рівень.
Коротка примітка щодо справедливості: рівні обсягу обчислюються з вашої торгової активності на платформі, а не з розміру гаманця. Користувач з меншим банкролом, але який дозволяє боту торгувати послідовно, підніметься по рівнях швидше, ніж той, хто вносить великий баланс і залишає його без діла. Це навмисно — ми хочемо винагороджувати людей, які справді використовують StormBot так, як він задуманий.
Графік
Жодних обіцянок щодо точних дат — це серйозна інженерна робота, і ми не збираємося поспішати з нею у продакшен. Але ось чесна дорожня карта:
- Зараз: Обліковий запис Google Cloud підготовлено, запитано ранній доступ до Vertex AI, прототип shadow-mode будується на історичних даних.
- Найближчі тижні: Рефакторинг edge-двигуна для роботи з імовірнісними ансамблями. Паралельне логування поряд із поточним двигуном.
- Наступні тижні: Shadow run у продакшені — прогнози WeatherNext 2 логуються для кожного ринку, порівнюються з фактичними розв'язаннями, звіти про калібрування публікуються тут.
- Після проходження бенчмарків: Закрита альфа для користувачів Tier 1. Цикл зворотного зв'язку з інженерною командою. Фінальне налаштування.
- Після альфи: Поетапне розгортання через Tier 2, потім Tier 3.
Що ви можете зробити просто зараз
Ваш обсяг торгів починає враховуватися сьогодні. Кожна угода, яку StormBot розміщує від вашого імені з цього моменту, зараховується до вашого рівня WeatherNext 2 на запуску. Переконайтеся, що ваш бот працює, ваш банкрол налаштований, а ваш гаманець підключений. Ми опублікуємо точні порогові обсяги в найближчі тижні — але користувачі, які піднімуться в таблиці лідерів рано, будуть тими, хто першим ступить до оновленого рушія.