Home Classifica Avvia app

Collegare WeatherNext 2 al Motore

Abbiamo iniziato a lavorare su quello che è, di gran lunga, il più grande aggiornamento di accuratezza delle previsioni che abbiamo mai tentato: integrare WeatherNext 2 di Google DeepMind nel nucleo probabilistico di StormBot. Se ci riusciamo in modo pulito, cambia la qualità sottostante di ogni margine che il motore segnala — e quindi il payoff atteso di ogni ordine che indirizziamo.

Il resto di questa nota copre cosa sia davvero WeatherNext 2, dove supera il modello NOAA GFS da cui dipendiamo oggi, perché l'integrazione è più difficile di quanto sembri e come l'accesso sarà suddiviso in livelli in base al volume di trading sulla piattaforma una volta rilasciato.

Cos'è WeatherNext 2?

WeatherNext 2 è il modello di previsione più avanzato mai rilasciato da Google DeepMind. Presentato a fine 2025 e già alla base di Google Search, Gemini, Pixel Weather e Google Maps, rappresenta un salto generazionale nella previsione meteo su scala globale.

Invece di risolvere le equazioni fisiche che governano l'atmosfera — l'approccio usato da decenni da NOAA GFS, dal modello ECMWF e da ogni sistema tradizionale — WeatherNext 2 impara il comportamento atmosferico direttamente da decenni di dati storici. È costruito su un'architettura completamente nuova chiamata Rete Generativa Funzionale (FGN), che inietta rumore controllato direttamente nel modello in modo che ogni previsione che produce rimanga fisicamente coerente e internamente coerente tra le variabili.

Generazione 8× più rapida

Una previsione ensemble completa richiede meno di un minuto su una singola TPU. I modelli basati sulla fisica richiedono ore su un supercomputer per produrre lo stesso output.

99,9% delle variabili migliorate

Supera il precedente stato dell'arte nel 99,9% delle variabili (temperatura, vento, umidità, pressione, precipitazioni) e su tutti gli orizzonti da 0 a 15 giorni.

Risoluzione 1 ora

Previsioni ora per ora aggiornate quattro volte al giorno — molto più granulari della risoluzione nativa 3-6 ore di GFS per gli orizzonti che operiamo.

Centinaia di scenari

Genera in meno di un minuto un ensemble probabilistico di centinaia di futuri plausibili, fornendoci una vera distribuzione — non un singolo valore deterministico.

Perché è più accurato di NOAA GFS

Il Global Forecast System di NOAA è un pezzo di ingegneria fenomenale — ma è stato progettato in un'era precedente al deep learning, e i limiti della modellazione basata sulla fisica sono evidenti da anni. C'è un motivo per cui ECMWF ha storicamente superato GFS di circa un giorno intero di abilità di previsione, e per cui quasi tutti i principali provider meteo hanno silenziosamente iniziato a sovrapporre l'IA al loro stack tradizionale.

Ecco dove WeatherNext 2 supera GFS specificamente sui tipi di previsioni di temperatura a corto-medio termine che guidano i contratti meteo di Polymarket:

  • Pattern atmosferici appresi vs. equazioni risolte — GFS approssima l'atmosfera discretizzandola in una griglia e risolvendo Navier-Stokes a ogni timestep. Quelle approssimazioni si accumulano nel tempo. WeatherNext 2 ha appreso il comportamento non lineare completo dell'atmosfera dai dati di reanalisi ERA5, quindi non accumula la stessa classe di errore numerico.
  • Output probabilistico nativo — GFS ti dà una previsione per run. Per avere una distribuzione ti serve GEFS (l'ensemble), che aggiunge costo e latenza. WeatherNext 2 emette la distribuzione completa nativamente, quindi vediamo la probabilità reale che una città raggiunga 14°C, non solo una stima puntuale da avvolgere bayesianamente da soli.
  • Risoluzione effettiva più alta — WeatherNext 2 produce previsioni globali ora per ora. GFS opera con risoluzione orizzontale di 13 km e output di 3 ore per il nostro range di trading. Per contratti city-specific daily-max e daily-min, quella granularità temporale aggiuntiva è un vero edge.
  • Migliore sulle code — i benchmark di DeepMind mostrano i maggiori guadagni su eventi a bassa probabilità e alto impatto: ondate di freddo, cupole di calore, tempeste. Questi sono esattamente i mercati in cui vivono le code mal prezzate e da cui provengono i nostri trade più grandi.
  • Ensemble fisicamente coerenti — l'architettura FGN significa che ogni scenario nell'ensemble è internamente coerente (uno scenario ventoso ha anche il gradiente di pressione corrispondente). Questo è ciò che rende le probabilità utilizzabili per il pricing.

Per gli orizzonti 0-3 giorni che costituiscono il grosso dei mercati meteo di Polymarket, valutazioni indipendenti collocano i moderni modelli IA allo stesso livello — e spesso davanti — all'IFS di punta di ECMWF, che è a sua volta significativamente davanti a GFS. Tradotto approssimativamente: qualche decimo di grado di RMSE sulla temperatura massima giornaliera a 48 ore, e una calibrazione notevolmente più stretta sugli eventi rari.

Perché questo cambia l'esito delle operazioni

L'intero margine di StormBot deriva da un unico passaggio meccanico: stimare la vera probabilità di un intervallo di temperatura in modo più accurato di quanto la stia prezzando il mercato di Polymarket. Tutto ciò che ne consegue — la decisione SÌ/NO di Claude, il dimensionamento Kelly, la logica di uscita, gli stop dinamici — si basa su quella stima di probabilità.

Oggi facciamo l'ensemble di GFS, ECMWF, UKMO e NWS, li miscelliamo bayesianamente con la climatologia storica NCEI, e applichiamo una CDF normale sulla distribuzione dell'errore di previsione per arrivare a una probabilità. Funziona. Ma è fondamentalmente limitato dall'accuratezza dei modelli sottostanti.

Sostituire quella stima di probabilità con WeatherNext 2 come segnale primario ha effetti molto concreti:

  • Rilevamento dell'edge più nitido. Mezzo grado di miglioramento nel RMSE di previsione si traduce direttamente in 1-3% in più di edge rilevabile sui mercati borderline che attualmente vengono filtrati dalla nostra soglia del 2%. Più segnali raggiungono Claude.
  • Migliore calibrazione. Quando diciamo "78% di probabilità di YES", deve effettivamente risolvere al 78% su un campione ampio. L'output probabilistico nativo di WeatherNext 2 è materialmente meglio calibrato di qualsiasi cosa possiamo sintetizzare da modelli deterministici.
  • Meno operazioni catastrofiche sulle code. La performance più forte del modello sugli eventi rari significa che sbagliamo il prezzo delle fat tails meno spesso — storicamente la nostra categoria più grande di perdite inattese.
  • Tempi di risposta del modello più rapidi. Il nostro ciclo attuale di fetch delle previsioni è limitato in latenza dalle API meteo gratuite con rate-limiting. Eseguire WeatherNext 2 tramite Vertex AI di Google Cloud significa che possiamo aggiornare le previsioni secondo il nostro programma, non il loro.

Perché è un problema difficile

Vogliamo essere chiari: questo è il lavoro di ingegneria più difficile che abbiamo intrapreso dalla migrazione dell'infrastruttura di v2. "Collegare un nuovo modello" non è mai semplice come sembra, e WeatherNext 2 in particolare ha diversi spigoli vivi.

1
Accesso ai dati e infrastruttura
Le previsioni WeatherNext 2 sono fornite tramite Earth Engine, BigQuery e Vertex AI. Nessuno di questi è un drop-in replacement degli endpoint HTTP gratuiti che attualmente usiamo. Servono auth, gestione delle quote, controlli dei costi e un layer di caching che ammortizzi le chiamate di inferenza pagate sui nostri 97+ combo città/data attivi.
2
Integrazione di output probabilistico
Il nostro calcolatore di edge è stato progettato attorno a una singola previsione puntuale deterministica più un modello di errore Gaussiano. WeatherNext 2 ci dà un ensemble completo di diverse centinaia di scenari per città. Ricablare il motore di edge per consumare una distribuzione empirica reale (invece di fingerne una) richiede riscrivere il cuore di engine/edge.js e ritarare ogni soglia che Claude usa.
3
Interpolazione della griglia ai punti città
WeatherNext 2 produce una griglia globale. I contratti meteo di Polymarket si risolvono a specifiche stazioni meteo nominate (es. LaGuardia per NYC, Heathrow per Londra). Serve interpolazione bilineare o nearest-station accurata dalla griglia nativa del modello alla stazione di risoluzione esatta — e poi downscaling per effetti microclimatici locali dove rilevante.
4
Costo per previsione
Ogni combinazione città/data che monitoriamo diventa una chiamata di inferenza Vertex AI a pagamento. Con ~1.975 mercati meteo attivi su ~97 combinazioni uniche, un'implementazione ingenua brucerebbe il budget rapidamente. Stiamo costruendo una strategia di refresh a livelli: i mercati ad alta convinzione ottengono aggiornamenti frequenti, le città a basso volume ottengono cicli più lenti.
5
Retrocompatibilità
Non stiamo eliminando GFS/ECMWF/UKMO/NWS. L'architettura finale usa WeatherNext 2 come segnale primario con i modelli tradizionali come sanity check. Se WeatherNext 2 è in netto disaccordo con i modelli di fisica, quel disaccordo stesso diventa una feature su cui Claude può ragionare — non un motivo per fidarsi ciecamente di nessuna delle due parti.
6
Validazione out-of-sample
Prima di azionare l'interruttore, dobbiamo eseguire WeatherNext 2 in shadow per settimane in parallelo al bot live — registrando cosa avrebbe previsto per ogni mercato e poi confrontando con quanto si è effettivamente risolto. Un modello che fa benchmarking eccellente su ERA5 reanalysis deve comunque guadagnarsi un posto in un loop di trading in produzione con soldi veri.

Miglioramento atteso dell'accuratezza

Sulla base dei benchmark pubblicati da DeepMind e della nostra modellazione interna di come l'errore di previsione si propaga attraverso il nostro calcolatore di edge, ecco dove ci aspettiamo che si muovano le prestazioni di StormBot una volta completata l'integrazione:

RMSE della temperatura (orizzonte 48 h)
−28%
Riduzione attesa dell'errore di previsione al segno dei 2 giorni — l'orizzonte in cui la maggior parte dei nostri trade si risolve.
Calibrazione delle probabilità (Brier Score)
+18%
Probabilità meglio calibrate significano che i livelli di confidenza di Claude corrispondono effettivamente alla realtà, il che migliora direttamente il sizing Kelly.
Precisione su eventi estremi (freddo/caldo estremi)
+40%
I guadagni più grandi sono sugli eventi rari — esattamente dove i mercati sbagliano di più il prezzo e dove vivono le nostre vittorie più grandi.
Edge rilevabile per scansione
+35%
Previsioni più nitide spingono più mercati sopra la nostra soglia di edge del 2%, dando a Claude più segnali di alta qualità da valutare.

Accesso: a volume per gli utenti fedeli

Dobbiamo essere onesti riguardo all'economia in gioco. L'inferenza di WeatherNext 2 tramite Vertex AI non è gratuita, e il lavoro infrastrutturale rappresenta un significativo investimento ingegneristico. Non possiamo darlo a tutti dal primo giorno — e, francamente, non vogliamo. Gli utenti che hanno effettivamente costruito StormBot per renderlo ciò che è oggi dovrebbero essere i primi a ottenerlo.

Quando WeatherNext 2 verrà lanciato, l'accesso sarà limitato dal volume di trading sulla piattaforma. Il tuo volume di trading cumulativo — ogni dollaro di pUSD che hai impiegato tramite StormBot nei mercati Polymarket — diventa la valuta che sblocca il motore potenziato. Più hai operato, prima e più profondo sarà il tuo accesso.

Come funzioneranno i livelli di volume

Le soglie finali dei tier saranno annunciate più vicino al lancio, ma la struttura è già definita:

  • Tier 1 — fondatori: il gruppo con il più alto volume cumulativo ottiene la prima ondata di accesso a WeatherNext 2 durante l'alpha chiusa. Output ensemble completo, massima cadenza di aggiornamento, canale di feedback diretto con il team di ingegneria.
  • Tier 2 — utenti avanzati: seconda ondata durante la beta. Segnale WeatherNext 2 completo con frequenza di aggiornamento leggermente ridotta.
  • Tier 3 — trader attivi: rollout generale con WeatherNext 2 a complemento dello stack esistente GFS/ECMWF/UKMO/NWS.
  • Sotto la soglia: continua sull'attuale stack multi-modello, che rimane completamente supportato ed è esso stesso migliorato in modo indipendente.

Il tuo volume di trading viene tracciato automaticamente — ogni trade che il bot piazza per tuo conto conta. Non devi fare nulla di speciale. Più usi la piattaforma, più alto è il tuo tier.

Una nota rapida sull'equità: i livelli di volume sono calcolati in base alla tua attività di trading sulla piattaforma, non in base alla dimensione del tuo wallet. Un utente con un bankroll più piccolo ma che lascia operare il bot con costanza salirà di livello più velocemente di chi deposita un saldo elevato e lo lascia inattivo. Questo è voluto — vogliamo premiare le persone che usano davvero StormBot come è stato progettato per essere usato.

Cronologia

Nessuna promessa su date esatte — questa è ingegneria seria, e non la affretteremo in produzione. Ma ecco la roadmap onesta:

  • Ora: Account Google Cloud provisionato, accesso anticipato a Vertex AI richiesto, prototipo shadow-mode in costruzione contro dati storici.
  • Prossime settimane: Refactoring del motore edge per utilizzare insiemi probabilistici. Logging parallelo accanto al motore attuale.
  • Settimane successive: Shadow run in produzione — predizioni di WeatherNext 2 registrate per ogni mercato, confrontate con le risoluzioni effettive, con report di calibrazione pubblicati qui.
  • Una volta superati i benchmark: Alpha chiusa per utenti Tier 1. Ciclo di feedback con il team di ingegneria. Messa a punto finale.
  • Dopo l'alpha: Rollout per fasi attraverso Tier 2 e poi Tier 3.

Cosa puoi fare proprio ora

Il tuo volume di trading inizia a contare oggi. Ogni operazione che StormBot piazza per tuo conto da questo momento in poi conta per il tuo livello WeatherNext 2 al lancio. Assicurati che il tuo bot sia in esecuzione, che il tuo bankroll sia configurato e che il tuo portafoglio sia connesso. Pubblicheremo le soglie di volume esatte nelle prossime settimane — ma gli utenti che scaleranno la classifica per primi saranno quelli che entreranno per primi nel motore potenziato.

Leggi dopo

Due nuovi modi per giocare con il cielo: Storm Spin e Storm Bet sono attivi

Leggi l'articolo

Il Lock di Hong Kong: Abbiamo Smesso di Prevedere la Città e Iniziato a Leggerla

Leggi l'articolo

StormBot in numeri: 9.592 trader, 2,87 mln di dollari di profitti per i membri ed esattamente quanto costa farlo funzionare

Leggi l'articolo
Tutti gli articoli