Wiring WeatherNext 2 Into the StormBot Engine

IN ENTWICKLUNG · ALPHA

WeatherNext 2 in die Engine verdrahten

21. April 2026

Wir haben mit dem begonnen, was mit deutlichem Abstand das größte Prognose-Genauigkeits-Upgrade ist, das wir je versucht haben: Google DeepMinds WeatherNext 2 in den StormBot-Wahrscheinlichkeitskern einzufalten. Wenn wir das sauber hinbekommen, ändert es die zugrunde liegende Qualität jeder Edge, die die Engine kennzeichnet — und damit den erwarteten Ertrag jeder Order, die wir leiten.

Der Rest dieser Notiz behandelt, was WeatherNext 2 tatsächlich ist, wo es dem NOAA-GFS-Modell überlegen ist, von dem wir heute abhängen, warum die Integration schwieriger ist, als es klingt, und wie der Zugang nach handelsvolumen auf der Plattform gestaffelt wird, sobald wir live gehen.

Was ist WeatherNext 2?

WeatherNext 2 ist das fortschrittlichste Vorhersagemodell, das Google DeepMind je veröffentlicht hat. Ende 2025 vorgestellt und bereits in Google Search, Gemini, Pixel Weather und Google Maps im Einsatz, stellt es einen Generationssprung in der globalen Wettervorhersage dar.

Statt die physikalischen Gleichungen zu lösen, die die Atmosphäre beschreiben — der Ansatz, den NOAA GFS, das ECMWF-Modell und alle traditionellen Systeme seit Jahrzehnten verwenden — lernt WeatherNext 2 das atmosphärische Verhalten direkt aus jahrzehntelangen historischen Daten. Es basiert auf einer brandneuen Architektur namens Funktionales Generatives Netzwerk (FGN), die kontrolliertes Rauschen direkt in das Modell injiziert, sodass jede erzeugte Prognose physikalisch konsistent und über alle Variablen hinweg intern kohärent bleibt.

8× schnellere Generierung

Eine vollständige Ensemble-Prognose dauert weniger als eine Minute auf einer einzelnen TPU. Physikbasierte Modelle benötigen Stunden auf einem Supercomputer für dasselbe Ergebnis.

99,9 % der Variablen verbessert

Übertrifft den bisherigen Stand der Technik bei 99,9 % der Variablen (Temperatur, Wind, Feuchtigkeit, Druck, Niederschlag) und allen Vorhersagezeiträumen von 0 bis 15 Tagen.

1-Stunden-Auflösung

Stundenpräzise Vorhersagen, viermal täglich aktualisiert — deutlich feiner als die native 3-bis-6-Stunden-Auflösung von GFS für die von uns getradeten Horizonte.

Hunderte von Szenarien

Erzeugt in unter einer Minute ein probabilistisches Ensemble aus Hunderten plausibler Zukünfte und liefert uns eine echte Verteilung — keine deterministische Einzelschätzung.

Warum es genauer ist als NOAA GFS

NOAAs Global Forecast System ist eine phänomenale Ingenieursleistung — aber es wurde in einer Ära vor Deep Learning entworfen, und die Grenzen physikbasierter Modellierung sind seit Jahren offensichtlich. Es gibt einen Grund, warum ECMWF historisch GFS um rund einen vollen Tag Vorhersagegüte übertroffen hat und warum fast jeder große Wetteranbieter heimlich begonnen hat, KI auf seinen traditionellen Stack zu legen.

Hier zieht WeatherNext 2 an GFS vorbei — speziell bei den Arten von kurz- bis mittelfristigen Temperaturvorhersagen, die Polymarkets Wetterkontrakte antreiben:

Gelernte Atmosphärenmuster vs. gelöste Gleichungen — GFS nähert die Atmosphäre an, indem sie in ein Gitter diskretisiert wird und Navier-Stokes bei jedem Zeitschritt gelöst wird. Diese Näherungen häufen sich mit der Zeit. WeatherNext 2 hat das volle nichtlineare Verhalten der Atmosphäre aus ERA5-Reanalyse-Daten gelernt, sodass es nicht dieselbe Klasse numerischer Fehler ansammelt.
Native probabilistische Ausgabe — GFS gibt eine Vorhersage pro Lauf. Für eine Verteilung benötigt man GEFS (das Ensemble), was Kosten und Latenz hinzufügt. WeatherNext 2 gibt die vollständige Verteilung nativ aus, wir sehen also die tatsächliche Wahrscheinlichkeit, dass eine Stadt 14°C erreicht, statt einer Punktschätzung, die wir selbst Bayesianisch einwickeln müssten.
Höhere effektive Auflösung — WeatherNext 2 erstellt stundengenaue globale Prognosen. GFS läuft operationell mit einer horizontalen Auflösung von 13 km und 3-Stunden-Output für unseren Trading-Bereich. Für stadtspezifische Daily-Max- und Daily-Min-Kontrakte ist diese zusätzliche zeitliche Granularität ein echter Vorteil.
Besser bei den Rändern — DeepMinds Benchmarks zeigen die größten Gewinne bei Ereignissen mit geringer Wahrscheinlichkeit und hohem Impact: Kälteeinbrüche, Hitzedome, Stürme. Das sind genau die Märkte, in denen falsch bepreiste Tails leben und aus denen unsere größten Trades stammen.
Physikalisch konsistente Ensembles — die FGN-Architektur bedeutet, dass jedes Szenario im Ensemble intern konsistent ist (ein windiges Szenario hat auch den entsprechenden Druckgradienten). Genau das macht die Wahrscheinlichkeiten für die Preisfindung nutzbar.

Für die 0–3-Tage-Horizonte, die den Großteil von Polymarkets Wettermärkten ausmachen, ordnen unabhängige Auswertungen moderne KI-Modelle in dieselbe Liga ein wie — und oft sogar vor — ECMWFs Flaggschiff-IFS, das selbst deutlich vor GFS liegt. Grob übersetzt: ein paar Zehntel Grad RMSE bei der Tageshöchsttemperatur bei 48 Stunden und merklich engere Kalibrierung bei seltenen Ereignissen.

Warum das das Ergebnis der Trades verändert

Die gesamte Edge von StormBot ergibt sich aus einem mechanischen Schritt: die wahre Wahrscheinlichkeit eines Temperatur-Buckets genauer zu schätzen, als der Polymarket-Markt sie bepreist. Alles Nachgelagerte — Claudes YES/NO-Entscheidung, Kelly-Größenbestimmung, Exit-Logik, Trailing-Stops — speist sich aus dieser Wahrscheinlichkeitsschätzung.

Heute ensemblen wir GFS, ECMWF, UKMO und NWS, mischen sie Bayesianisch mit der historischen NCEI-Klimatologie und wenden eine Normal-CDF auf die Vorhersagefehler-Verteilung an, um zu einer Wahrscheinlichkeit zu kommen. Es funktioniert. Aber es ist grundsätzlich durch die Genauigkeit der zugrunde liegenden Modelle begrenzt.

Diese Wahrscheinlichkeitsschätzung durch WeatherNext 2 als primäres Signal zu ersetzen hat sehr konkrete Auswirkungen:

Schärfere Edge-Erkennung. Eine halbe Grad Verbesserung der Prognose-RMSE übersetzt sich direkt in 1-3% mehr erkennbaren Edge auf Borderline-Märkten, die derzeit von unserer 2%-Schwelle herausgefiltert werden. Mehr Signale erreichen Claude.
Bessere Kalibrierung. Wenn wir „78 % Wahrscheinlichkeit für YES" sagen, muss es bei einer großen Stichprobe tatsächlich zu 78 % so eintreten. Die native probabilistische Ausgabe von WeatherNext 2 ist deutlich besser kalibriert als alles, was wir aus deterministischen Modellen synthetisieren können.
Weniger katastrophale Tail-Trades. Die stärkere Leistung des Modells bei seltenen Ereignissen bedeutet, dass wir die Fat Tails seltener falsch bepreisen — historisch unsere größte Kategorie unerwarteter Verluste.
Schnellere Modell-Turnaround. Unser aktueller Vorhersage-Fetch-Zyklus ist durch ratenbegrenzte kostenlose Wetter-APIs latenzbeschränkt. WeatherNext 2 über Vertex AI von Google Cloud zu betreiben bedeutet, dass wir Prognosen nach unserem eigenen Zeitplan aktualisieren können, nicht nach deren.

Warum das ein schwieriges Problem ist

Wir wollen ehrlich sein: Das ist die schwierigste Engineering-Arbeit, die wir seit der Infrastrukturmigration von v2 übernommen haben. "Ein neues Modell anschließen" ist nie so einfach, wie es klingt, und WeatherNext 2 insbesondere hat eine Reihe scharfer Kanten.

Datenzugang & Infrastruktur

WeatherNext-2-Vorhersagen werden über Earth Engine, BigQuery und Vertex AI bereitgestellt. Keines davon ist ein Drop-in-Ersatz für die kostenlosen HTTP-Endpunkte, die wir derzeit nutzen. Wir brauchen Auth, Quota-Management, Kostenkontrollen und eine Caching-Schicht, die die bezahlten Inferenz-Aufrufe über unsere 97+ aktiven Stadt/Datum-Kombinationen verteilt.

Integration probabilistischer Ausgaben

Unser Edge-Rechner wurde um eine einzelne deterministische Punktvorhersage plus ein Gaußsches Fehlermodell herum entwickelt. WeatherNext 2 liefert uns ein vollständiges Ensemble aus mehreren Hundert Szenarien pro Stadt. Die Edge-Engine so umzubauen, dass sie eine echte empirische Verteilung verarbeitet (statt eine vorzutäuschen), erfordert das Neuschreiben des Kerns von engine/edge.js und jeden Schwellenwert neu abzustimmen, den Claude nutzt.

Gitter-Interpolation auf Stadtpunkte

WeatherNext 2 gibt ein globales Gitter aus. Polymarkets Wetterkontrakte werden an spezifischen, namentlich genannten Wetterstationen aufgelöst (z. B. LaGuardia für NYC, Heathrow für London). Wir brauchen genaue bilineare oder Nearest-Station-Interpolation vom nativen Gitter des Modells zur exakten Auflösungsstation — und anschließend Downscaling für lokale Mikroklimaeffekte, wo relevant.

Kosten pro Vorhersage

Jede Stadt/Datum-Kombination, die wir überwachen, wird zu einem kostenpflichtigen Vertex-AI-Inference-Aufruf. Bei ~1.975 aktiven Wettermärkten über ~97 einzigartige Kombinationen würde eine naive Implementierung das Budget schnell verbrennen. Wir bauen eine gestaffelte Refresh-Strategie: Märkte mit hoher Überzeugung erhalten häufige Updates, Städte mit geringem Volumen langsamere Zyklen.

Abwärtskompatibilität

Wir reißen GFS/ECMWF/UKMO/NWS nicht heraus. Die finale Architektur nutzt WeatherNext 2 als primäres Signal mit den traditionellen Modellen als Plausibilitätsprüfung. Wenn WeatherNext 2 stark von den physikalischen Modellen abweicht, wird diese Diskrepanz selbst zu einem Feature, über das Claude nachdenken kann — kein Grund, einer Seite blind zu vertrauen.

Out-of-Sample-Validierung

Bevor wir umschalten, müssen wir WeatherNext 2 wochenlang im Schatten gegen den Live-Bot laufen lassen — und protokollieren, was es für jeden Markt vorhergesagt hätte, und dann mit dem tatsächlichen Ergebnis vergleichen. Ein Modell, das auf ERA5-Reanalyse-Benchmarks bestens abschneidet, muss sich seinen Platz in einer Produktions-Trading-Schleife mit echtem Geld trotzdem erst verdienen.

Erwartete Genauigkeitssteigerung

Basierend auf den veröffentlichten Benchmarks von DeepMind und unserer eigenen internen Modellierung, wie sich der Vorhersagefehler durch unseren Edge-Rechner fortpflanzt, hier ist, wo wir erwarten, dass sich die Leistung von StormBot bewegt, sobald die Integration eintrifft:

Temperatur-RMSE (48-Stunden-Horizont)

−28%

Erwartete Reduktion des Prognosefehlers am 2-Tage-Punkt — dem Horizont, an dem die Mehrheit unserer Trades aufgelöst wird.

Wahrscheinlichkeitskalibrierung (Brier-Score)

+18%

Besser kalibrierte Wahrscheinlichkeiten bedeuten, dass Claudes Confidence-Levels tatsächlich der Realität entsprechen, was die Kelly-Größenbestimmung direkt verbessert.

Genauigkeit bei Extremereignissen (extreme Kälte/Hitze)

+40%

Die größten Gewinne sind bei seltenen Ereignissen — genau dort, wo Märkte am stärksten falsch bepreisen und wo unsere größten Siege leben.

Erkennbarer Edge pro Scan

+35%

Schärfere Prognosen drücken mehr Märkte über unsere 2%-Edge-Schwelle und geben Claude mehr hochwertige Signale zur Bewertung.

Zugang: nach Volumen für treue Nutzer

Wir müssen hier ehrlich über die Ökonomie sein. WeatherNext-2-Inferenz über Vertex AI ist nicht kostenlos, und die Infrastrukturarbeit stellt eine erhebliche Engineering-Investition dar. Wir können es nicht jedem am ersten Tag geben — und ehrlich gesagt wollen wir das auch nicht. Die Nutzer, die StormBot tatsächlich zu dem gemacht haben, was es heute ist, sollten diejenigen sein, die es zuerst bekommen.

Wenn WeatherNext 2 startet, wird der Zugang begrenzt durch das Handelsvolumen auf der Plattform. Dein kumuliertes Handelsvolumen — jeder Dollar pUSD, den du über StormBot in Polymarket-Märkte eingesetzt hast — wird zur Währung, die die aufgewertete Engine freischaltet. Je mehr du gehandelt hast, desto früher und tiefer dein Zugang.

So funktionieren die Volumen-Stufen

Die endgültigen Tier-Schwellen werden näher am Launch bekanntgegeben, die Struktur steht aber fest:

Tier 1 — Gründer: Die Gruppe mit dem höchsten kumulativen Volumen erhält die erste Welle des WeatherNext 2-Zugangs während der Closed Alpha. Vollständige Ensemble-Ausgabe, höchste Aktualisierungsrate, direkter Feedback-Kanal zum Engineering-Team.
Tier 2 — Power-User: zweite Welle während der Beta. Volles WeatherNext-2-Signal mit leicht reduzierter Aktualisierungsrate.
Tier 3 — aktive Trader: allgemeiner Rollout mit WeatherNext 2 als Ergänzung zum bestehenden GFS/ECMWF/UKMO/NWS-Stack.
Unter dem Schwellenwert: läuft auf dem aktuellen Multi-Modell-Stack weiter, der vollständig unterstützt bleibt und selbst unabhängig verbessert wird.

Ihr Handelsvolumen wird automatisch verfolgt — jeder Trade, den der Bot in Ihrem Namen platziert, zählt. Sie müssen nichts Besonderes tun. Je mehr Sie die Plattform nutzen, desto höher Ihr Tier.

Eine kurze Anmerkung zur Fairness: Volumenstufen werden aus deiner Handelsaktivität auf der Plattform berechnet, nicht aus deiner Wallet-Größe. Ein Nutzer mit einem kleineren Bankroll, der den Bot aber konsistent handeln lässt, wird die Stufen schneller erklimmen als jemand, der ein großes Guthaben einzahlt und untätig liegen lässt. Das ist beabsichtigt — wir wollen die Leute belohnen, die StormBot tatsächlich so nutzen, wie er genutzt werden soll.

Zeitplan

Keine Versprechen zu exakten Daten — das ist ernsthafte Ingenieursarbeit, und wir werden sie nicht überstürzt in die Produktion bringen. Aber hier ist die ehrliche Roadmap:

Jetzt: Google-Cloud-Konto bereitgestellt, Vertex-AI-Early-Access angefordert, Shadow-Mode-Prototyp wird gegen historische Daten gebaut.
Nächste Wochen: Refaktorisierung der Edge-Engine zur Verarbeitung probabilistischer Ensembles. Paralleles Logging neben der aktuellen Engine.
Folgende Wochen: Shadow-Run in der Produktion — WeatherNext 2-Prognosen werden für jeden Markt protokolliert, mit den tatsächlichen Auflösungen verglichen und Kalibrierungsberichte hier veröffentlicht.
Sobald die Benchmarks bestanden sind: Geschlossene Alpha für Tier-1-Nutzer. Feedback-Schleife mit dem Engineering-Team. Letztes Feintuning.
Nach Alpha: Stufenweiser Rollout über Tier 2, dann Tier 3.

Was du jetzt tun kannst

Dein Handelsvolumen beginnt zu zählen heute. Jeder Trade, den StormBot von diesem Moment an in deinem Namen platziert, zählt zu deiner WeatherNext-2-Stufe beim Start. Stelle sicher, dass dein Bot läuft, dein Bankroll konfiguriert ist und deine Wallet verbunden ist. Wir werden die genauen Volumenschwellen in den kommenden Wochen veröffentlichen — aber die Nutzer, die früh die Rangliste erklimmen, werden diejenigen sein, die als Erste in die aufgewertete Engine einsteigen.

Als Nächstes lesen

Alle Artikel