WeatherNext 2를 엔진에 연결하기
우리는 지금까지 시도한 것 중 단연 가장 큰 예측 정확도 업그레이드에 착수했습니다: Google DeepMind의 WeatherNext 2를 StormBot 확률 코어에 통합하는 것. 우리가 이를 깔끔하게 성공시키면, 엔진이 표시하는 모든 엣지의 근본적인 품질을 바꾸게 되고 — 따라서 우리가 라우팅하는 모든 주문의 기대 수익도 바뀝니다.
이 노트의 나머지 부분은 WeatherNext 2가 실제로 무엇인지, 오늘날 우리가 의존하는 NOAA GFS 모델보다 어디에서 앞서는지, 통합이 들리는 것보다 왜 더 어려운지, 그리고 출시 후 플랫폼 내 트레이딩 거래량에 따라 접근 권한이 어떻게 계층화될지를 다룹니다.
WeatherNext 2란?
WeatherNext 2는 Google DeepMind이 출시한 가장 진보된 예보 모델입니다. 2025년 말 공개되어 이미 Google Search, Gemini, Pixel Weather, Google Maps를 구동하고 있으며, 지구 규모 날씨 예측의 세대적 도약을 의미합니다.
대기를 지배하는 물리 방정식을 푸는 방식 — NOAA GFS, ECMWF 모델, 그리고 모든 전통 시스템이 수십 년간 사용한 접근 — 대신, WeatherNext 2는 수십 년의 과거 데이터로부터 대기 거동을 직접 학습합니다. 다음이라 불리는 완전히 새로운 아키텍처 위에 만들어졌습니다 함수형 생성 네트워크(FGN), 모델에 직접 제어된 노이즈를 주입하여 생성되는 모든 예보가 물리적으로 일관되고 변수 전반에 걸쳐 내부적으로 일관되게 유지됩니다.
8배 빠른 생성
전체 앙상블 예보는 단일 TPU에서 1분 이내에 완료됩니다. 물리 기반 모델은 동일한 결과를 내기 위해 슈퍼컴퓨터에서 몇 시간이 걸립니다.
변수의 99.9% 개선
이전 최고 성능을 변수의 99.9%(기온, 풍속, 습도, 기압, 강수)와 0~15일 모든 리드 타임에서 능가합니다.
1시간 해상도
하루 4번 갱신되는 시간별 예측 — 우리가 거래하는 기간에서 GFS의 자체 3~6시간 해상도보다 훨씬 정밀합니다.
수백 가지 시나리오
1분 이내에 수백 가지 가능한 미래의 확률적 앙상블을 생성하여, 단일 결정론적 추정이 아닌 진짜 분포를 제공합니다.
왜 NOAA GFS보다 정확한가
NOAA의 Global Forecast System은 경이로운 엔지니어링이지만, 딥러닝 이전의 시대에 설계되었고 물리 기반 모델링의 한계는 오랫동안 분명했습니다. ECMWF가 역사적으로 GFS를 약 하루 분량의 예보 능력만큼 능가해온 이유, 그리고 거의 모든 주요 기상 사업자가 조용히 전통 스택 위에 AI를 얹기 시작한 이유에는 그만한 까닭이 있습니다.
WeatherNext 2가 GFS를 앞서는 지점은 바로 Polymarket 날씨 계약을 움직이는 단기-중기 기온 예보에서 입니다:
- 학습된 대기 패턴 vs. 풀어낸 방정식 — GFS는 대기를 격자에 이산화하고 매 시간 단계마다 Navier-Stokes를 풀어 근사합니다. 이러한 근사값은 시간이 지남에 따라 누적됩니다. WeatherNext 2는 ERA5 재해석 데이터에서 대기의 전체 비선형 거동을 학습했으므로 같은 종류의 수치 오차를 누적하지 않습니다.
- 네이티브 확률 출력 — GFS는 실행당 한 가지 예보를 제공합니다. 분포를 얻으려면 GEFS(앙상블)가 필요한데, 이는 비용과 지연을 추가합니다. WeatherNext 2는 전체 분포를 네이티브로 출력하므로, 도시가 14°C에 도달할 실제 확률을 볼 수 있습니다 — 우리가 직접 베이지안으로 감싸야 하는 점 추정값이 아니라.
- 더 높은 유효 해상도 — WeatherNext 2는 시간별 글로벌 예보를 생성합니다. GFS는 13km 수평 해상도와 3시간 출력으로 우리의 거래 범위에서 운영됩니다. 도시별 일일 최대 및 일일 최소 계약의 경우 그 추가 시간 세분성은 진정한 엣지입니다.
- 테일(극단값)에서 더 우수 — DeepMind의 벤치마크는 저확률, 고임팩트 이벤트(한파, 열돔, 폭풍)에서 가장 큰 이득을 보여줍니다. 이것이 바로 잘못 가격이 매겨진 꼬리가 존재하고 우리의 가장 큰 거래가 나오는 시장입니다.
- 물리적으로 일관된 앙상블 — FGN 아키텍처는 앙상블의 각 시나리오가 내부적으로 일관성이 있음을 의미합니다(바람이 강한 시나리오에는 일치하는 기압 경사도도 있습니다). 이것이 가격 책정에 확률을 사용할 수 있게 만드는 것입니다.
Polymarket 날씨 시장의 대부분을 차지하는 0~3일 시야에서, 독립 평가는 최신 AI 모델을 ECMWF의 대표 IFS와 동급 — 또는 종종 그 위 — 에 두며, IFS 자체도 GFS보다 의미 있게 앞섭니다. 개략적으로: 48시간 시점 일 최고기온의 RMSE에서 수십분의 1도, 그리고 희귀 이벤트에서 눈에 띄게 더 좁은 보정.
이것이 거래 결과를 바꾸는 이유
StormBot의 모든 엣지는 단 하나의 기계적인 단계에서 나옵니다: Polymarket 마켓이 가격을 책정하는 것보다 더 정확하게 온도 구간의 실제 확률을 추정하는 것입니다. 그 다음의 모든 것 — Claude의 YES/NO 결정, 켈리 사이징, 청산 로직, 트레일링 스톱 — 은 모두 그 확률 추정치에 기반합니다.
오늘 우리는 GFS, ECMWF, UKMO, NWS를 앙상블하고, NCEI 과거 기후학과 베이지안 방식으로 혼합하며, 예보 오차 분포에 정규 CDF를 적용하여 확률을 얻습니다. 작동합니다. 하지만 본질적으로 기반 모델의 정확도에 의해 상한이 정해집니다.
이 확률 추정값을 WeatherNext 2를 주된 신호로 대체하면 매우 구체적인 효과가 있습니다:
- 더 선명한 엣지 감지. 예보 RMSE의 0.5도 개선은 현재 2% 임계값에 의해 필터링되는 경계선 시장에서 1-3% 더 많은 감지 가능한 엣지로 직접 변환됩니다. 더 많은 신호가 Claude에 도달합니다.
- 더 나은 보정. "YES 78% 확률"이라고 말할 때, 큰 표본에서 실제로 78%로 결제되어야 합니다. WeatherNext 2의 네이티브 확률 출력은 결정론적 모델에서 합성할 수 있는 어떤 것보다도 실질적으로 더 잘 보정되어 있습니다.
- 극단값에서 발생하는 치명적 거래 감소. 희귀 이벤트에서의 더 강한 모델 성능은 우리가 두꺼운 꼬리를 잘못 가격 매기는 빈도가 줄어든다는 뜻입니다 — 역사적으로 우리의 가장 큰 예상치 못한 손실 카테고리.
- 모델 회전 속도 향상. 우리의 현재 예보 페치 사이클은 레이트 제한이 있는 무료 날씨 API에 의해 지연이 묶입니다. WeatherNext 2를 Google Cloud의 Vertex AI를 통해 실행하면 그들의 일정이 아니라 우리 자체 일정으로 예보를 갱신할 수 있습니다.
이것이 어려운 문제인 이유
솔직히 말씀드리겠습니다: 이것은 v2의 인프라 마이그레이션 이후 우리가 맡은 가장 어려운 엔지니어링 작업입니다. "새 모델을 연결한다"는 것은 들리는 것만큼 결코 간단하지 않으며, 특히 WeatherNext 2에는 여러 날카로운 가장자리가 있습니다.
engine/edge.js 그리고 Claude가 사용하는 모든 임계값을 다시 조정해야 합니다.예상 정확도 개선
DeepMind이 발표한 벤치마크와 예보 오차가 우리의 엣지 계산기를 통해 전파되는 방식에 대한 자체 내부 모델링을 바탕으로, 통합이 완료되면 StormBot의 성능이 어떻게 변할 것으로 예상하는지는 다음과 같습니다:
접근: 충성도 높은 사용자에게 볼륨 기준으로 제공
여기서 경제성에 대해 솔직해야 합니다. Vertex AI를 통한 WeatherNext 2 추론은 무료가 아니며, 인프라 작업은 상당한 엔지니어링 투자를 의미합니다. 우리는 첫날부터 모든 사람에게 제공할 수 없으며 — 솔직히 그러고 싶지도 않습니다. 오늘날 StormBot을 실제로 지금의 모습으로 만든 사용자들이 가장 먼저 그것을 받아야 할 사람들입니다.
WeatherNext 2가 출시되면 접근 권한은 다음과 같습니다: 플랫폼 거래량에 따라 제한됨. 당신의 누적 거래량 — StormBot을 통해 Polymarket 마켓에 투입한 모든 pUSD — 이 업그레이드된 엔진을 잠금 해제하는 통화가 됩니다. 더 많이 거래할수록, 더 일찍 그리고 더 깊게 접근할 수 있습니다.
볼륨 티어 작동 방식
최종 티어 임계값은 출시 시점이 가까워지면 발표되지만, 구조는 이미 확정되었습니다:
- Tier 1 — 창립 멤버: 누적 거래량이 가장 높은 그룹이 비공개 알파 동안 WeatherNext 2 액세스의 첫 번째 물결을 받습니다. 전체 앙상블 출력, 가장 높은 갱신 빈도, 엔지니어링 팀에 대한 직접 피드백 채널.
- Tier 2 — 파워 유저: 베타 기간 중 2차 웨이브. WeatherNext 2 풀 시그널, 새로고침 주기는 약간 낮음.
- Tier 3 — 활성 트레이더: 기존 GFS/ECMWF/UKMO/NWS 스택을 보완하는 WeatherNext 2의 일반 출시.
- 임계값 미만: 현재의 멀티 모델 스택에서 계속되며, 이는 완전히 지원되고 독립적으로 개선되고 있습니다.
거래량은 자동으로 추적됩니다 — 봇이 사용자를 대신해 놓는 모든 거래가 카운트됩니다. 특별한 작업을 할 필요가 없습니다. 플랫폼을 더 많이 사용할수록 등급이 높아집니다.
공정성에 관한 간단한 메모: 거래량 등급은 지갑 규모가 아니라 플랫폼 내 거래 활동을 기준으로 계산됩니다. 더 적은 자금으로 봇이 꾸준히 거래하도록 두는 사용자는 큰 잔액을 예치하고 방치하는 사람보다 등급을 더 빨리 올립니다. 이는 의도적입니다 — 우리는 StormBot을 설계된 대로 실제로 사용하는 사람들에게 보상하고자 합니다.
타임라인
정확한 날짜에 대한 약속은 없습니다 — 이것은 진지한 엔지니어링이며, 우리는 그것을 프로덕션에 서둘러 투입하지 않을 것입니다. 그러나 여기 정직한 로드맵이 있습니다:
- 현재: Google Cloud 계정 프로비저닝, Vertex AI 조기 액세스 요청, 과거 데이터에 대해 섀도우 모드 프로토타입 구축 중.
- 앞으로 몇 주: 확률적 앙상블을 처리하도록 엣지 엔진 리팩토링. 현재 엔진과 병렬로 로깅.
- 이후 몇 주: 프로덕션에서의 섀도우 런 — 모든 시장에 대한 WeatherNext 2 예측이 기록되고, 실제 해결과 비교되며, 보정 보고서가 여기에 게시됩니다.
- 벤치마크를 통과한 후: Tier 1 사용자 대상 클로즈드 알파. 엔지니어링 팀과의 피드백 루프. 최종 튜닝.
- 알파 이후: Tier 2를 거쳐 Tier 3로 단계적 배포.
지금 할 수 있는 일
여러분의 거래량이 카운트되기 시작합니다 오늘. 지금 이 순간부터 StormBot이 당신을 대신해 실행하는 모든 거래는 출시 시점의 당신의 WeatherNext 2 등급에 반영됩니다. 봇이 실행 중이고, 뱅크롤이 설정되어 있으며, 지갑이 연결되어 있는지 확인하세요. 정확한 거래량 임계값은 앞으로 몇 주 안에 공개할 예정입니다 — 하지만 일찍 리더보드를 오르는 사용자들이 업그레이드된 엔진에 가장 먼저 진입하는 사람들이 될 것입니다.