Wiring WeatherNext 2 Into the StormBot Engine

W TRAKCIE PRAC · ALFA

Podłączanie WeatherNext 2 do silnika

21 kwietnia 2026

Rozpoczęliśmy to, co jest z dużą przewagą największym ulepszeniem dokładności prognoz, jakiego kiedykolwiek się podjęliśmy: włączenie WeatherNext 2 od Google DeepMind do rdzenia prawdopodobieństwa StormBota. Jeśli wylądujemy z tym czysto, zmienia to fundamentalną jakość każdego edge'a, który silnik oznacza — a więc oczekiwaną wypłatę każdego zlecenia, które kierujemy.

Pozostała część tej notatki opisuje, czym właściwie jest WeatherNext 2, gdzie wyprzedza model NOAA GFS, na którym dziś polegamy, dlaczego integracja jest trudniejsza, niż się wydaje, oraz jak dostęp będzie podzielony na poziomy według wolumenu handlu na platformie po wdrożeniu.

Czym jest WeatherNext 2?

WeatherNext 2 to najbardziej zaawansowany model prognozowania, jaki kiedykolwiek wypuścił Google DeepMind. Zaprezentowany pod koniec 2025 i już napędzający Google Search, Gemini, Pixel Weather i Google Maps, stanowi pokoleniowy skok w globalnym prognozowaniu pogody.

Zamiast rozwiązywać równania fizyki rządzące atmosferą — podejście stosowane od dekad przez NOAA GFS, model ECMWF i każdy tradycyjny system — WeatherNext 2 uczy się zachowania atmosfery bezpośrednio z dekad danych historycznych. Zbudowany jest na całkowicie nowej architekturze zwanej Funkcjonalna Sieć Generatywna (FGN), który wstrzykuje kontrolowany szum bezpośrednio do modelu, aby każda prognoza, którą wytwarza, pozostała fizycznie spójna i wewnętrznie spójna między zmiennymi.

8× szybsza generacja

Pełna prognoza ensemble zajmuje mniej niż minutę na jednym TPU. Modele oparte na fizyce wymagają godzin na superkomputerze, aby dać ten sam wynik.

99,9% zmiennych poprawione

Pokonuje wcześniejszy stan techniki na 99,9% zmiennych (temperatura, wiatr, wilgotność, ciśnienie, opady) i we wszystkich horyzontach od 0 do 15 dni.

Rozdzielczość 1 godzina

Prognozy godzinowe odświeżane cztery razy dziennie — znacznie precyzyjniejsze niż natywna rozdzielczość 3-6 godzin GFS dla horyzontów, na których handlujemy.

Setki scenariuszy

Generuje probabilistyczny ensemble setek prawdopodobnych przyszłości w mniej niż minutę, dając nam prawdziwy rozkład — nie pojedynczy deterministyczny strzał.

Dlaczego jest dokładniejszy niż NOAA GFS

Global Forecast System NOAA to fenomenalne dzieło inżynierii — ale został zaprojektowany w erze sprzed deep learning, a granice modelowania opartego na fizyce są oczywiste od lat. Jest powód, dla którego ECMWF historycznie wyprzedza GFS o około cały dzień skuteczności prognozy, i dlaczego niemal każdy duży dostawca pogody po cichu zaczął nakładać AI na swój tradycyjny stos.

Tu właśnie WeatherNext 2 wyprzedza GFS — szczególnie w rodzajach krótko- i średnioterminowych prognoz temperatury, które napędzają kontrakty pogodowe Polymarket:

Wyuczone wzorce atmosferyczne vs. rozwiązane równania — GFS aproksymuje atmosferę dyskretyzując ją na siatkę i rozwiązując równania Naviera-Stokesa w każdym kroku czasowym. Te przybliżenia kumulują się w czasie. WeatherNext 2 nauczył się pełnego nieliniowego zachowania atmosfery z danych re-analizy ERA5, więc nie kumuluje tej samej klasy błędów numerycznych.
Natywne wyjście probabilistyczne — GFS daje jedną prognozę na uruchomienie. Aby uzyskać rozkład, potrzebujesz GEFS (ensemble), co dodaje koszt i opóźnienie. WeatherNext 2 zwraca pełen rozkład natywnie, więc widzimy faktyczne prawdopodobieństwo, że miasto osiągnie 14°C, a nie tylko pojedynczą estymację, którą musimy sami opakować bayesowsko.
Wyższa efektywna rozdzielczość — WeatherNext 2 produkuje godzinowe globalne prognozy. GFS działa operacyjnie z rozdzielczością poziomą 13 km i wyjściem 3-godzinnym dla naszego zakresu handlu. Dla kontraktów dziennych max i min specyficznych dla miasta, ta dodatkowa granularność czasowa to prawdziwy edge.
Lepiej na ogonach — benchmarki DeepMind pokazują największe zyski przy zdarzeniach o niskim prawdopodobieństwie i wysokim wpływie: zimnych falach, kopułach upałów, burzach. To dokładnie te rynki, na których żyją źle wycenione ogony i z których pochodzą nasze największe transakcje.
Spójne fizycznie ensemble — architektura FGN oznacza, że każdy scenariusz w zespole jest wewnętrznie spójny (wietrzny scenariusz ma również odpowiadający mu gradient ciśnienia). To właśnie sprawia, że prawdopodobieństwa są użyteczne do wyceny.

Dla horyzontów 0-3 dni stanowiących większość pogodowych rynków Polymarket, niezależne oceny stawiają nowoczesne modele AI na tym samym poziomie — a często wyżej — niż flagowy IFS ECMWF, który sam jest istotnie przed GFS. Z grubsza: kilka dziesiątych stopnia RMSE dla maksymalnej dobowej temperatury w okolicy 48 h i wyraźnie ciaśniejsza kalibracja w przypadku rzadkich zdarzeń.

Dlaczego to zmienia wynik transakcji

Cała przewaga StormBot wynika z jednego mechanicznego kroku: oszacowania prawdziwego prawdopodobieństwa przedziału temperatury dokładniej, niż wycenia je rynek Polymarket. Wszystko, co następuje dalej — decyzja TAK/NIE Claude, sizing Kelly, logika wyjścia, kroczące stopy — opiera się na tym oszacowaniu prawdopodobieństwa.

Dziś łączymy GFS, ECMWF, UKMO i NWS w ensemble, mieszamy je bayesowsko z historyczną klimatologią NCEI i stosujemy normalny CDF nad rozkładem błędu prognozy, aby uzyskać prawdopodobieństwo. Działa. Ale to jest fundamentalnie ograniczone dokładnością modeli bazowych.

Zastąpienie tej estymacji prawdopodobieństwa WeatherNext 2 jako głównym sygnałem ma bardzo konkretne skutki:

Bardziej precyzyjne wykrywanie przewagi. Pół stopnia poprawy w RMSE prognozy przekłada się bezpośrednio na 1-3% więcej wykrywalnego edge na rynkach granicznych, które obecnie są odfiltrowywane przez nasz próg 2%. Więcej sygnałów dociera do Claude'a.
Lepsza kalibracja. Kiedy mówimy „78% prawdopodobieństwa YES", musi to faktycznie kończyć się na 78% w dużej próbie. Natywne wyjście probabilistyczne WeatherNext 2 jest istotnie lepiej skalibrowane niż cokolwiek, co możemy zsyntetyzować z modeli deterministycznych.
Mniej katastrofalnych transakcji na ogonach. Lepsza wydajność modelu na rzadkich zdarzeniach oznacza, że rzadziej źle wyceniamy grube ogony — historycznie nasza największa kategoria nieoczekiwanych strat.
Szybszy obrót modelu. Nasz obecny cykl pobierania prognoz jest ograniczony latencją przez darmowe API pogodowe z rate-limit. Uruchomienie WeatherNext 2 przez Vertex AI Google Cloud oznacza, że możemy odświeżać prognozy według własnego harmonogramu, a nie ich.

Dlaczego to trudny problem

Chcemy być szczerzy: to najtrudniejsza praca inżynierska, jakiej podjęliśmy się od czasu migracji infrastruktury v2. "Podłączenie nowego modelu" nigdy nie jest tak proste, jak się wydaje, a WeatherNext 2 w szczególności ma wiele ostrych krawędzi.

Dostęp do danych i instalacja

Prognozy WeatherNext 2 dostarczane są przez Earth Engine, BigQuery i Vertex AI. Żaden z nich nie jest gotowym zamiennikiem darmowych endpointów HTTP, których teraz używamy. Potrzebujemy uwierzytelniania, zarządzania kwotami, kontroli kosztów i warstwy cache amortyzującej płatne wywołania inferencji na naszych 97+ aktywnych combo miasto/data.

Integracja wyjścia probabilistycznego

Nasz kalkulator przewagi został zaprojektowany wokół pojedynczej deterministycznej prognozy punktowej plus modelu błędu Gaussa. WeatherNext 2 daje nam pełen ensemble kilkuset scenariuszy na miasto. Przeprogramowanie silnika przewagi tak, aby konsumował realny rozkład empiryczny (zamiast go udawać), wymaga przepisania rdzenia engine/edge.js i ponownie dostroić każdy próg używany przez Claude'a.

Interpolacja siatki do punktów miast

WeatherNext 2 zwraca globalną siatkę. Pogodowe kontrakty Polymarket rozstrzygają się na konkretnych nazwanych stacjach pogodowych (np. LaGuardia dla Nowego Jorku, Heathrow dla Londynu). Potrzebujemy dokładnej interpolacji bilinearnej lub nearest-station z natywnej siatki modelu do dokładnej stacji rozstrzygnięcia — a następnie downscalingu dla efektów lokalnego mikroklimatu, gdy to istotne.

Koszt na prognozę

Każda kombinacja miasto/data, którą monitorujemy, staje się płatnym wywołaniem inferencji Vertex AI. Przy ~1975 aktywnych rynkach pogodowych na ~97 unikalnych kombinacjach naiwna implementacja szybko zjadłaby budżet. Budujemy strategię odświeżania w warstwach: rynki o wysokiej pewności otrzymują częste aktualizacje, miasta o niskim wolumenie wolniejsze cykle.

Wsteczna kompatybilność

Nie wyrywamy GFS/ECMWF/UKMO/NWS. Ostateczna architektura wykorzystuje WeatherNext 2 jako sygnał główny, a tradycyjne modele jako sanity check. Jeśli WeatherNext 2 ostro różni się od modeli fizycznych, sama ta rozbieżność staje się cechą, którą Claude może analizować — a nie powodem do ślepego zaufania jakiejkolwiek stronie.

Walidacja poza próbą

Zanim przestawimy przełącznik, musimy przez tygodnie uruchamiać WeatherNext 2 w trybie shadow równolegle z live-botem — logując, co przewidziałby dla każdego rynku, a potem porównując z faktycznymi rozstrzygnięciami. Model, który ślicznie wypada w benchmarkach na re-analizie ERA5, wciąż musi zapracować na miejsce w produkcyjnej pętli tradingu z prawdziwymi pieniędzmi.

Oczekiwana poprawa dokładności

Na podstawie opublikowanych benchmarków DeepMind oraz naszego własnego wewnętrznego modelowania tego, jak błąd prognozy propaguje się przez nasz kalkulator przewagi, oto gdzie spodziewamy się ruchu wydajności StormBota po wdrożeniu integracji:

RMSE temperatury (horyzont 48 h)

−28%

Oczekiwana redukcja błędu prognozy przy znaczniku 2 dni — horyzoncie, na którym rozliczana jest większość naszych transakcji.

Kalibracja prawdopodobieństw (Brier Score)

+18%

Lepiej skalibrowane prawdopodobieństwa oznaczają, że poziomy pewności Claude'a faktycznie odpowiadają rzeczywistości, co bezpośrednio poprawia sizing Kelly'ego.

Dokładność zdarzeń skrajnych (ekstremalne zimno/upał)

+40%

Największe zyski są na rzadkich wydarzeniach — dokładnie tam, gdzie rynki najbardziej źle wyceniają i gdzie żyją nasze największe wygrane.

Wykrywalny edge na skan

+35%

Ostrzejsze prognozy popychają więcej rynków powyżej naszego progu edge 2%, dając Claude'owi więcej wysokiej jakości sygnałów do oceny.

Dostęp: zależny od wolumenu dla lojalnych użytkowników

Musimy być szczerzy co do ekonomii tutaj. Wnioskowanie WeatherNext 2 przez Vertex AI nie jest darmowe, a prace nad infrastrukturą stanowią znaczącą inwestycję inżynieryjną. Nie możemy dać tego wszystkim pierwszego dnia — i szczerze mówiąc, nie chcemy. Użytkownicy, którzy faktycznie zbudowali StormBot do tego, czym jest dzisiaj, powinni być tymi, którzy dostaną to pierwsi.

Po premierze WeatherNext 2 dostęp będzie ograniczone przez wolumen handlu na platformie. Twój skumulowany wolumen handlowy — każdy dolar pUSD, który wdrożyłeś przez StormBota na rynki Polymarket — staje się walutą, która odblokowuje ulepszony silnik. Im więcej handlowałeś, tym wcześniejszy i głębszy twój dostęp.

Jak będą działać poziomy wolumenu

Ostateczne progi poziomów zostaną ogłoszone bliżej premiery, ale struktura jest już ustalona:

Tier 1 — założyciele: grupa o najwyższym skumulowanym wolumenie otrzymuje pierwszą falę dostępu do WeatherNext 2 podczas zamkniętej alfy. Pełny output ensemble, najwyższa częstotliwość odświeżania, bezpośredni kanał feedbacku do zespołu inżynieryjnego.
Tier 2 — zaawansowani użytkownicy: druga fala podczas bety. Pełny sygnał WeatherNext 2 z lekko obniżoną częstotliwością odświeżania.
Tier 3 — aktywni traderzy: ogólne wdrożenie z WeatherNext 2 jako uzupełnieniem istniejącego stosu GFS/ECMWF/UKMO/NWS.
Poniżej progu: kontynuuje na obecnym stosie multi-model, który pozostaje w pełni wspierany i sam jest niezależnie ulepszany.

Twój wolumen handlu jest śledzony automatycznie — każda transakcja, którą bot zawiera w twoim imieniu, się liczy. Nie musisz nic specjalnego robić. Im więcej korzystasz z platformy, tym wyższy twój tier.

Krótka uwaga o uczciwości: poziomy wolumenu są obliczane na podstawie Twojej aktywności handlowej na platformie, a nie wielkości portfela. Użytkownik z mniejszym kapitałem, ale pozwalający botowi handlować konsekwentnie, awansuje na wyższe poziomy szybciej niż ktoś, kto wpłaca duże saldo i pozostawia je bezczynne. Jest to zamierzone — chcemy nagradzać ludzi, którzy faktycznie używają StormBota tak, jak został zaprojektowany.

Harmonogram

Brak obietnic co do dokładnych dat — to poważna inżynieria, i nie zamierzamy jej spieszyć do produkcji. Ale oto uczciwa mapa drogowa:

Teraz: Konto Google Cloud uruchomione, wczesny dostęp do Vertex AI zażądany, prototyp shadow-mode budowany na danych historycznych.
Najbliższe tygodnie: Refaktoryzacja silnika edge tak, by przyjmował zespoły probabilistyczne. Równoległe logowanie obok obecnego silnika.
Kolejne tygodnie: Shadow run w produkcji — prognozy WeatherNext 2 logowane dla każdego rynku, porównywane z rzeczywistymi rozwiązaniami, z raportami kalibracji publikowanymi tutaj.
Po pomyślnym przejściu testów porównawczych: Zamknięta alfa dla użytkowników Tier 1. Pętla informacji zwrotnej z zespołem inżynierskim. Końcowe dostrajanie.
Po alfie: Wdrożenie etapowe przez Tier 2, a następnie Tier 3.

Co możesz zrobić już teraz

Twój wolumen handlu zaczyna się liczyć dziś. Każda transakcja, którą StormBot składa w twoim imieniu od tego momentu, liczy się do twojego poziomu WeatherNext 2 przy starcie. Upewnij się, że twój bot działa, twój bankroll jest skonfigurowany, a twój portfel jest połączony. Opublikujemy dokładne progi wolumenu w nadchodzących tygodniach — ale użytkownicy, którzy wcześnie wespną się na tablicę liderów, będą tymi, którzy jako pierwsi wejdą do ulepszonego silnika.

Przeczytaj dalej

Wszystkie artykuły