Inicio Clasificación Iniciar App

Conectando WeatherNext 2 al Motor

Hemos comenzado lo que es, por mucho, la mayor mejora de precisión de pronóstico que jamás hayamos intentado: integrar WeatherNext 2 de Google DeepMind en el núcleo de probabilidad de StormBot. Si lo logramos limpiamente, cambia la calidad subyacente de cada ventaja que el motor señala — y por lo tanto la recompensa esperada de cada orden que enrutamos.

El resto de esta nota cubre qué es realmente WeatherNext 2, dónde aventaja al modelo NOAA GFS del que dependemos hoy, por qué la integración es más difícil de lo que parece y cómo el acceso se escalonará por volumen de trading en la plataforma una vez que lo lancemos.

¿Qué es WeatherNext 2?

WeatherNext 2 es el modelo de pronóstico más avanzado que Google DeepMind ha lanzado. Presentado a finales de 2025 y ya impulsando Google Search, Gemini, Pixel Weather y Google Maps, representa un salto generacional en cómo se predice el clima a escala global.

En lugar de resolver las ecuaciones físicas que gobiernan la atmósfera — el enfoque que NOAA GFS, el modelo ECMWF y todo sistema tradicional han usado durante décadas — WeatherNext 2 aprende el comportamiento atmosférico directamente desde décadas de datos históricos. Está construido sobre una arquitectura completamente nueva llamada Red Generativa Funcional (FGN), que inyecta ruido controlado directamente en el modelo para que cada pronóstico que produce permanezca físicamente consistente e internamente coherente entre variables.

Generación 8× más rápida

Un pronóstico de ensemble completo tarda menos de un minuto en una sola TPU. Los modelos basados en física necesitan horas en una supercomputadora para producir el mismo resultado.

99.9 % de variables mejoradas

Supera al anterior estado del arte en el 99.9% de las variables (temperatura, viento, humedad, presión, precipitación) y en todos los plazos desde 0 hasta 15 días.

Resolución de 1 hora

Predicciones hora por hora actualizadas cuatro veces al día — mucho más finas que la resolución nativa de 3 a 6 horas de GFS para los horizontes que operamos.

Cientos de escenarios

Genera un ensemble probabilístico de cientos de futuros plausibles en menos de un minuto, dándonos una distribución real — no una sola conjetura determinista.

Por qué es más preciso que NOAA GFS

El Global Forecast System de NOAA es una pieza fenomenal de ingeniería — pero fue diseñado en una era anterior al deep learning, y los límites del modelado basado en física llevan años siendo evidentes. Hay una razón por la que ECMWF ha superado históricamente a GFS por aproximadamente un día completo de habilidad de pronóstico, y por qué casi todos los principales proveedores meteorológicos han empezado discretamente a superponer IA sobre su stack tradicional.

Aquí es donde WeatherNext 2 se adelanta a GFS específicamente en los tipos de pronósticos de temperatura de corto a medio plazo que impulsan los contratos meteorológicos de Polymarket:

  • Patrones atmosféricos aprendidos vs. ecuaciones resueltas — GFS aproxima la atmósfera discretizándola en una cuadrícula y resolviendo Navier-Stokes en cada paso de tiempo. Esas aproximaciones se acumulan con el tiempo. WeatherNext 2 aprendió el comportamiento no lineal completo de la atmósfera a partir de datos de reanálisis ERA5, así que no acumula esa misma clase de error numérico.
  • Salida probabilística nativa — GFS te da un pronóstico por ejecución. Para obtener una distribución necesitas GEFS (el ensemble), lo que añade costo y latencia. WeatherNext 2 produce la distribución completa de forma nativa, así que vemos la probabilidad real de que una ciudad alcance 14°C, no solo una estimación puntual que tenemos que envolver bayesianamente nosotros mismos.
  • Mayor resolución efectiva — WeatherNext 2 produce pronósticos globales hora por hora. GFS opera con resolución horizontal de 13 km y salida de 3 horas para nuestro rango de trading. Para contratos de máximo-diario y mínimo-diario específicos de ciudad, esa granularidad temporal extra es un edge genuino.
  • Mejor en los extremos — los benchmarks de DeepMind muestran las mayores ganancias en eventos de baja probabilidad y alto impacto: olas de frío, domos de calor, tormentas. Estos son exactamente los mercados donde viven las colas mal valoradas y de donde vienen nuestros mayores trades.
  • Ensembles físicamente coherentes — la arquitectura FGN significa que cada escenario en el ensamble es internamente consistente (un escenario con viento también tiene el gradiente de presión correspondiente). Esto es lo que hace que las probabilidades sean utilizables para fijar precios.

Para los horizontes de 0 a 3 días que constituyen la mayoría de los mercados meteorológicos de Polymarket, las evaluaciones independientes ubican a los modelos de IA modernos en el mismo nivel — y a menudo por encima — del IFS insignia de ECMWF, que por sí mismo está significativamente por delante de GFS. Una traducción aproximada: unas décimas de grado de RMSE en la temperatura máxima diaria a las 48 horas, y una calibración notablemente más ajustada en eventos raros.

Por qué esto cambia el resultado de las operaciones

Toda la ventaja de StormBot proviene de un paso mecánico: estimar la verdadera probabilidad de un rango de temperatura con más precisión de lo que el mercado de Polymarket la está valorando. Todo lo que viene después —la decisión de SÍ/NO de Claude, el dimensionamiento de Kelly, la lógica de salida, los stops dinámicos— se alimenta de esa estimación de probabilidad.

Hoy combinamos GFS, ECMWF, UKMO y NWS, los mezclamos bayesianamente con la climatología histórica de NCEI, y aplicamos una CDF normal sobre la distribución del error de pronóstico para llegar a una probabilidad. Funciona. Pero está fundamentalmente limitado por la precisión de los modelos subyacentes.

Reemplazar esa estimación de probabilidad con WeatherNext 2 como señal principal tiene efectos muy concretos:

  • Detección de ventaja más nítida. Medio grado de mejora en el RMSE del pronóstico se traduce directamente en 1-3% más de edge detectable en mercados borderline que actualmente son filtrados por nuestro umbral del 2%. Más señales llegan a Claude.
  • Mejor calibración. Cuando decimos "78 % de probabilidad de YES", debe resolverse realmente al 78 % sobre una muestra grande. La salida probabilística nativa de WeatherNext 2 está materialmente mejor calibrada que cualquier cosa que podamos sintetizar a partir de modelos determinísticos.
  • Menos operaciones catastróficas en las colas. El desempeño más fuerte del modelo en eventos raros significa que sobrevaloramos menos las colas pesadas — históricamente nuestra mayor categoría de pérdidas inesperadas.
  • Tiempo de respuesta del modelo más rápido. Nuestro ciclo actual de obtención de pronósticos está limitado por la latencia de APIs meteorológicas gratuitas con limitación de tasa. Ejecutar WeatherNext 2 a través de Vertex AI de Google Cloud significa que podemos refrescar pronósticos en nuestra propia agenda, no en la suya.

Por qué este es un problema difícil

Queremos ser directos: este es el trabajo de ingeniería más difícil que hemos asumido desde la migración de infraestructura de v2. "Conectar un modelo nuevo" nunca es tan simple como suena, y WeatherNext 2 en particular tiene varios bordes afilados.

1
Acceso a datos y conectividad
Los pronósticos de WeatherNext 2 se entregan a través de Earth Engine, BigQuery y Vertex AI. Ninguno de esos es un reemplazo directo de los endpoints HTTP gratuitos que actualmente usamos. Necesitamos autenticación, gestión de cuotas, controles de costo y una capa de caché que amortice las llamadas de inferencia pagadas entre nuestros 97+ combos activos de ciudad/fecha.
2
Integración de salida probabilística
Nuestra calculadora de ventaja se diseñó alrededor de un único pronóstico puntual determinista más un modelo de error gaussiano. WeatherNext 2 nos da un ensemble completo de varios cientos de escenarios por ciudad. Reconfigurar el motor de ventaja para que consuma una distribución empírica real (en lugar de fingir una) requiere reescribir el núcleo de engine/edge.js y reajustar cada umbral que Claude usa.
3
Interpolación de cuadrícula a puntos de ciudad
WeatherNext 2 produce una cuadrícula global. Los contratos meteorológicos de Polymarket se resuelven en estaciones meteorológicas con nombre específico (p. ej., LaGuardia para Nueva York, Heathrow para Londres). Necesitamos interpolación bilineal o de estación más cercana precisa desde la cuadrícula nativa del modelo hasta la estación de resolución exacta — y luego un downscaling para efectos microclimáticos locales donde corresponda.
4
Costo por pronóstico
Cada combinación ciudad/fecha que monitoreamos se convierte en una llamada pagada de inferencia de Vertex AI. Con ~1,975 mercados meteorológicos activos en ~97 combos únicos, una implementación ingenua agotaría el presupuesto rápidamente. Estamos construyendo una estrategia de actualización por niveles: los mercados de alta convicción reciben actualizaciones frecuentes, las ciudades de bajo volumen obtienen ciclos más lentos.
5
Compatibilidad hacia atrás
No estamos eliminando GFS/ECMWF/UKMO/NWS. La arquitectura final usa WeatherNext 2 como señal principal con los modelos tradicionales como verificación de cordura. Si WeatherNext 2 discrepa abruptamente de los modelos físicos, ese desacuerdo en sí mismo se convierte en una característica sobre la que Claude puede razonar — no en una razón para confiar ciegamente en ninguna de las partes.
6
Validación fuera de muestra
Antes de cambiar el interruptor, tenemos que ejecutar WeatherNext 2 en modo sombra contra el bot en vivo durante semanas — registrando lo que habría predicho para cada mercado y luego comparando con lo que realmente se resolvió. Un modelo que se desempeña hermosamente en benchmarks ERA5 todavía tiene que ganarse su lugar en un ciclo de trading en producción con dinero real detrás.

Mejora de precisión esperada

Basándonos en los benchmarks publicados por DeepMind y nuestro propio modelado interno de cómo se propaga el error de pronóstico a través de nuestro calculador de edge, aquí es donde esperamos que se mueva el rendimiento de StormBot una vez que aterrice la integración:

RMSE de temperatura (horizonte 48 h)
−28%
Reducción esperada en el error de pronóstico a la marca de 2 días — el horizonte donde se resuelven la mayoría de nuestros trades.
Calibración de probabilidad (puntuación Brier)
+18%
Probabilidades mejor calibradas significa que los niveles de confianza de Claude realmente coinciden con la realidad, lo que mejora directamente el dimensionamiento Kelly.
Precisión en eventos extremos (frío/calor extremos)
+40%
Las mayores ganancias están en los eventos raros — exactamente donde los mercados valoran peor y donde viven nuestras mayores victorias.
Edge detectable por escaneo
+35%
Pronósticos más nítidos empujan más mercados por encima de nuestro umbral del 2% de edge, dando a Claude más señales de alta calidad para evaluar.

Acceso: por volumen para usuarios fieles

Tenemos que ser honestos sobre la economía aquí. La inferencia de WeatherNext 2 a través de Vertex AI no es gratis, y el trabajo de infraestructura representa una inversión significativa en ingeniería. No podemos dárselo a todos el primer día — y, francamente, no queremos. Los usuarios que realmente han convertido a StormBot en lo que es hoy deberían ser los primeros en obtenerlo.

Cuando se lance WeatherNext 2, el acceso será restringido por el volumen de trading en la plataforma. Tu volumen de trading acumulado — cada dólar de pUSD que has desplegado a través de StormBot en mercados de Polymarket — se convierte en la moneda que desbloquea el motor mejorado. Cuanto más hayas operado, antes y más profundo será tu acceso.

Cómo funcionarán los niveles de volumen

Los umbrales finales de los niveles se anunciarán más cerca del lanzamiento, pero la estructura ya está fijada:

  • Tier 1 — Fundadores: el grupo con mayor volumen acumulado obtiene la primera ola de acceso a WeatherNext 2 durante la alpha cerrada. Salida completa de ensamble, mayor cadencia de refresco, canal directo de feedback con el equipo de ingeniería.
  • Tier 2 — Usuarios avanzados: segunda oleada durante la beta. Señal completa de WeatherNext 2 con una frecuencia de actualización ligeramente reducida.
  • Tier 3 — Traders activos: implementación general con WeatherNext 2 como complemento al stack existente de GFS/ECMWF/UKMO/NWS.
  • Por debajo del umbral: continúa en el stack multi-modelo actual, que sigue siendo totalmente compatible y se mejora de forma independiente.

Tu volumen de trading se rastrea automáticamente — cada trade que el bot coloca en tu nombre cuenta. No necesitas hacer nada especial. Cuanto más uses la plataforma, mayor será tu tier.

Una nota rápida sobre la equidad: los niveles de volumen se calculan a partir de tu actividad de trading en la plataforma, no del tamaño de tu billetera. Un usuario con un bankroll más pequeño pero que deja que el bot opere de forma constante subirá de nivel más rápido que alguien que deposita un saldo grande y lo deja inactivo. Esto es deliberado — queremos recompensar a las personas que realmente usan StormBot como está diseñado para ser usado.

Cronograma

Sin promesas de fechas exactas — esto es ingeniería seria, y no vamos a apresurarlo a producción. Pero aquí está la hoja de ruta honesta:

  • Ahora: Cuenta de Google Cloud aprovisionada, acceso temprano a Vertex AI solicitado, prototipo shadow-mode siendo construido contra datos históricos.
  • Próximas semanas: Refactorización del motor de edge para consumir conjuntos probabilísticos. Registro paralelo junto al motor actual.
  • Semanas siguientes: Shadow run en producción — predicciones de WeatherNext 2 registradas para cada mercado, comparadas con las resoluciones reales, con informes de calibración publicados aquí.
  • Una vez superados los benchmarks: Alfa cerrada para usuarios de Tier 1. Bucle de retroalimentación con el equipo de ingeniería. Ajustes finales.
  • Después del alfa: Despliegue por fases a través de Tier 2 y luego Tier 3.

Lo que puedes hacer ahora mismo

Tu volumen de trading empieza a contar hoy. Cada operación que StormBot realice en tu nombre a partir de este momento cuenta para tu nivel de WeatherNext 2 en el lanzamiento. Asegúrate de que tu bot esté funcionando, tu capital esté configurado y tu billetera esté conectada. Publicaremos los umbrales exactos de volumen en las próximas semanas — pero los usuarios que asciendan en la tabla de clasificación temprano serán los primeros en acceder al motor mejorado.

Leer a continuación

Dos nuevas formas de jugar con el cielo: Storm Spin y Storm Bet ya están disponibles

Leer artículo

El bloqueo de Hong Kong: dejamos de pronosticar la ciudad y empezamos a leerla

Leer artículo

StormBot en cifras: 9.592 traders, 2,87 millones de dólares en beneficios para los miembros y exactamente lo que cuesta operarlo

Leer artículo
Todos los artículos