WeatherNext 2をエンジンに組み込む
私たちは、これまで試みた中でも群を抜いて最大の予報精度アップグレードに着手しました: Google DeepMind の WeatherNext 2 を StormBot の確率コアに組み込むこと。私たちがそれをきれいに着地させれば、エンジンがフラグを立てるすべてのエッジの根本的な品質が変わり — したがって私たちがルーティングするすべての注文の期待ペイオフも変わります。
このノートの残りでは、WeatherNext 2 が実際に何であるか、それが今日私たちが依存している NOAA GFS モデルに対してどこで優位に立つのか、なぜ統合が聞こえるよりも難しいのか、そしてリリース後にアクセスがプラットフォーム上の取引高によってどのように段階分けされるのかを説明します。
WeatherNext 2 とは?
WeatherNext 2 は、Google DeepMind がこれまでに公開した最先端の予測モデルです。2025 年末に発表され、既に Google Search、Gemini、Pixel Weather、Google Maps を支えており、地球規模の天気予測における世代を超えた飛躍を示しています。
大気を支配する物理方程式を解く — NOAA GFS、ECMWF モデル、すべての従来システムが数十年使ってきたアプローチ — の代わりに、WeatherNext 2 は数十年分の歴史データから大気の挙動を直接学習します。以下と呼ばれる全く新しいアーキテクチャ上に構築されています 関数生成ネットワーク(FGN)、これは制御されたノイズをモデルに直接注入するので、生成されるすべての予報は物理的に一貫性を保ち、変数間で内部的にも一貫性を保ちます。
8 倍速い生成
完全なアンサンブル予測は単一の TPU で 1 分未満で完了します。物理ベースのモデルでは、同じ出力を得るのにスーパーコンピューター上で何時間もかかります。
99.9% の変数で改善
以前の最先端技術を 99.9% の変数(気温、風、湿度、気圧、降水)と 0〜15 日のすべてのリードタイムで上回ります。
1 時間ごとの解像度
1 日 4 回更新される時間単位の予測 — 当社が取引するホライズンにおいて、GFS のネイティブ 3〜6 時間解像度より遥かに精細です。
何百ものシナリオ
1 分以内に数百のもっともらしい未来からなる確率的アンサンブルを生成し、単一の決定論的な推測ではなく、真の分布を得られます。
なぜ NOAA GFS より正確なのか
NOAA の Global Forecast System は驚異的なエンジニアリングですが、ディープラーニング以前の時代に設計されており、物理ベースのモデリングの限界は何年も前から明らかです。ECMWF が歴史的に GFS をおよそ 1 日分の予測スキルで上回ってきた理由と、ほぼすべての主要気象プロバイダーが従来のスタックの上に AI を静かに重ね始めた理由には、それなりの根拠があります。
WeatherNext 2 が GFS を引き離すのは、Polymarket の天気契約を動かすような短期〜中期の気温予測においてです:
- 学習された大気パターン vs. 方程式の解 — GFS は大気をグリッドに離散化し、各タイムステップで Navier-Stokes 方程式を解いて近似します。これらの近似は時間とともに累積します。WeatherNext 2 は ERA5 再解析データから大気の完全な非線形挙動を学習しているため、同じ種類の数値誤差を蓄積しません。
- ネイティブな確率的出力 — GFS は実行ごとに 1 つの予測を返します。分布を得るには GEFS(アンサンブル)が必要で、これはコストとレイテンシを増やします。WeatherNext 2 はネイティブに完全な分布を出力するので、都市が 14°C に達する実際の確率が見えます — ベイズで自分たちで包む必要のある点推定ではなく。
- より高い実効解像度 — WeatherNext 2は1時間ごとのグローバル予報を生成します。GFSは13kmの水平分解能で運用され、当社の取引範囲では3時間出力を提供します。都市別の日次最高および日次最低契約では、その追加の時間的細分性は真のエッジです。
- テール(極端値)でより優れている — DeepMindのベンチマークは、低確率・高インパクトのイベント、つまり寒波、ヒートドーム、嵐において最大の利益を示しています。これらはまさに、ミスプライスされたテールが存在し、当社の最大の取引が生まれる市場です。
- 物理的に整合性のあるアンサンブル — FGNアーキテクチャは、アンサンブル内の各シナリオが内部的に一貫していることを意味します(風の強いシナリオには、対応する気圧勾配もあります)。これが、価格設定に使用可能な確率を生み出すものです。
Polymarket の天気市場の大部分を占める 0〜3 日のホライズンでは、独立した評価により、最新の AI モデルは ECMWF の旗艦 IFS と同等 — しばしばそれ以上 — のレベルに位置づけられ、IFS 自身も GFS をかなり上回っています。大まかな目安:48 時間時点の日最高気温で数十分の 1 度の RMSE 改善、そしてレアイベントでの目に見えてタイトなキャリブレーション。
なぜこれが取引結果を変えるのか
StormBotのエッジ全体は、たった一つの機械的なステップから生まれます: ある気温バケットの真の確率を、Polymarketのマーケットが値付けしているよりも正確に推定することです。その下流のすべて — ClaudeのYES/NO判断、ケリーサイジング、エグジットロジック、トレーリングストップ — はすべて、その確率推定を糧にしています。
現在は GFS、ECMWF、UKMO、NWS をアンサンブルし、NCEI の歴史的気候値とベイズ式に混合し、予測誤差分布に正規 CDF を適用して確率を得ます。機能します。しかし、根本的には基礎モデルの精度によって上限が決まります。
その確率推定を WeatherNext 2 を主シグナルに置き換えることには、極めて具体的な効果があります:
- よりシャープなエッジ検出。 予報RMSEの0.5度の改善は、現在2%のしきい値でフィルタリングされているボーダーラインの市場で検出可能なエッジが1〜3%増えることに直接つながります。より多くのシグナルがClaudeに届きます。
- より優れたキャリブレーション。 私たちが「YES の確率 78%」と言うとき、それは大きなサンプルで実際に 78% で決済される必要があります。WeatherNext 2 のネイティブな確率的出力は、決定論的モデルから合成できるどんなものより明確に良くキャリブレーションされています。
- テールリスクによる壊滅的取引が減少。 レアイベントでのモデル性能向上は、ファットテールのミスプライシングが減ることを意味します — 歴史的に当社で最も大きな予期しない損失のカテゴリです。
- モデルのターンアラウンドが高速化。 現在の予測取得サイクルは、レート制限のある無料天気 API のレイテンシに縛られています。WeatherNext 2 を Google Cloud の Vertex AI 経由で動かすと、予測を彼らのではなく自分たちのスケジュールで更新できます。
なぜこれは難しい問題なのか
率直に言いたいと思います:これはv2のインフラストラクチャ移行以来、私たちが取り組んだ中で最も困難なエンジニアリング作業です。「新しいモデルを接続する」というのは聞こえほど単純ではなく、特にWeatherNext 2には鋭いエッジがいくつかあります。
engine/edge.js そして Claude が使用するすべてのしきい値を再調整します。期待される精度向上
DeepMindが公表したベンチマークと、予測誤差が当社のエッジ計算機をどのように伝播するかについての社内モデリングに基づき、統合が実現した際にStormBotのパフォーマンスがどう変化すると見込んでいるかを示します:
アクセス:忠実なユーザー向けのボリュームゲート制
ここでの経済的な実情については正直に話す必要があります。Vertex AIを通じたWeatherNext 2の推論は無料ではなく、そのインフラ構築は多大なエンジニアリング投資を表しています。初日から全員に提供することはできませんし、率直に言って、そうしたいとも思っていません。今日のStormBotを実際に築き上げてきたユーザーこそが、最初にそれを手にすべきだと考えています。
WeatherNext 2 のローンチ時、アクセスは次のとおりになります: プラットフォーム上の取引高によって制限。あなたの累積取引ボリューム — StormBotを通じてPolymarket市場に投入したpUSDの一ドル一ドル — が、アップグレードされたエンジンのロックを解除する通貨になります。取引すればするほど、より早く、より深いアクセスが得られます。
ボリュームティアの仕組み
最終的なティアのしきい値はローンチ間近に発表されますが、構造はすでに確定しています:
- Tier 1 — ファウンダー: 累積取引量が最も高いグループが、クローズドアルファ中にWeatherNext 2アクセスの最初の波を受けます。完全なアンサンブル出力、最高のリフレッシュ頻度、エンジニアリングチームへの直接フィードバックチャネル。
- Tier 2 — パワーユーザー: ベータ期間中の第 2 波。WeatherNext 2 のフルシグナル、更新頻度はわずかに低下。
- Tier 3 — アクティブトレーダー: 既存の GFS/ECMWF/UKMO/NWS スタックを補完する WeatherNext 2 の一般展開。
- しきい値未満: 現在のマルチモデルスタックで継続し、完全にサポートされ続け、それ自体が独立して改善されています。
あなたの取引量は自動的に追跡されます — ボットがあなたに代わって行うすべての取引がカウントされます。特別なことをする必要はありません。プラットフォームを使えば使うほど、あなたのティアが高くなります。
公平性についての簡単な注記:出来高ティアはウォレットの規模ではなく、プラットフォーム上の取引活動から算出されます。小さなバンクロールでもボットに継続的に取引させているユーザーは、多額の残高を入金して放置しているユーザーよりも速くティアを上昇します。これは意図的なものです — StormBotを設計どおりに実際に使っている人々に報いたいのです。
タイムライン
正確な日付については約束しません — これは真剣なエンジニアリングであり、本番環境に急いで投入することはありません。しかし、これが正直なロードマップです:
- 現在: Google Cloudアカウントをプロビジョニング、Vertex AIの早期アクセスを要求、ヒストリカルデータに対してシャドウモードのプロトタイプを構築中。
- 今後数週間: 確率的アンサンブルを処理できるよう edge エンジンをリファクタリング。現行エンジンと並行してログ記録。
- その後の数週間: 本番環境でのシャドウラン — すべての市場でWeatherNext 2の予測を記録し、実際の決済と比較し、キャリブレーションレポートをここに公開します。
- ベンチマークをクリアしたら: Tier 1 ユーザー向けのクローズドアルファ。エンジニアリングチームとのフィードバックループ。最終調整。
- アルファ後: Tier 2、続いて Tier 3 への段階的ロールアウト。
今すぐできること
あなたの取引高がカウントされ始めます 本日。この瞬間以降、StormBotがあなたに代わって行うすべての取引は、ローンチ時のあなたのWeatherNext 2ティアにカウントされます。ボットが稼働していること、資金が設定されていること、ウォレットが接続されていることを確認してください。正確なボリュームしきい値は今後数週間で公開します — しかし、早期にリーダーボードを駆け上がるユーザーが、アップグレードされたエンジンに最初に踏み込む人々になります。