होम लीडरबोर्ड ऐप लॉन्च करें

WeatherNext 2 को इंजन में जोड़ना

हमने उस पर शुरुआत कर दी है जो, काफ़ी हद तक, अब तक का सबसे बड़ा पूर्वानुमान-सटीकता अपग्रेड है जिसका हमने कभी प्रयास किया है: Google DeepMind के WeatherNext 2 को StormBot प्रायिकता कोर में समेटना. यदि हम इसे साफ़ तरीके से उतारते हैं, तो यह इंजन द्वारा फ़्लैग किए गए हर एज की अंतर्निहित गुणवत्ता को बदल देता है — और इसलिए हर ऑर्डर का अपेक्षित भुगतान जिसे हम रूट करते हैं।

इस नोट का बाकी हिस्सा यह बताता है कि WeatherNext 2 वास्तव में क्या है, यह उस NOAA GFS मॉडल से कहाँ आगे निकलता है जिस पर हम आज निर्भर हैं, एकीकरण उतना आसान क्यों नहीं है जितना लगता है, और एक बार जब हम इसे शिप कर देंगे तो ऑन-प्लेटफ़ॉर्म ट्रेडिंग वॉल्यूम के आधार पर एक्सेस को कैसे स्तरबद्ध किया जाएगा।

WeatherNext 2 क्या है?

WeatherNext 2 अब तक का सबसे उन्नत पूर्वानुमान मॉडल है जिसे Google DeepMind ने जारी किया है। 2025 के अंत में अनावरण किया गया और पहले से ही Google Search, Gemini, Pixel Weather, और Google Maps को सशक्त कर रहा है, यह वैश्विक स्तर पर मौसम पूर्वानुमान में पीढ़ीगत छलाँग का प्रतिनिधित्व करता है।

वातावरण को नियंत्रित करने वाले भौतिकी समीकरणों को हल करने के बजाय — NOAA GFS, ECMWF मॉडल और हर पारंपरिक सिस्टम ने दशकों से जिस दृष्टिकोण का उपयोग किया है — WeatherNext 2 दशकों के ऐतिहासिक डेटा से सीधे वायुमंडलीय व्यवहार सीखता है। यह एक बिल्कुल नई आर्किटेक्चर पर बना है जिसे कहा जाता है फ़ंक्शनल जनरेटिव नेटवर्क (FGN), जो सीधे मॉडल में नियंत्रित शोर डालता है ताकि यह जो हर पूर्वानुमान उत्पन्न करता है वह भौतिक रूप से सुसंगत और चर के बीच आंतरिक रूप से सुसंगत बना रहे।

8× तेज़ जनरेशन

एक पूर्ण एन्सेम्बल पूर्वानुमान एकल TPU पर एक मिनट से कम समय लेता है। समान आउटपुट के लिए भौतिकी-आधारित मॉडलों को सुपरकंप्यूटर पर कई घंटे चाहिए।

99.9% चर सुधारे गए

पिछले अत्याधुनिक को 99.9% चरों (तापमान, हवा, आर्द्रता, दबाव, वर्षा) में और 0 से 15 दिनों तक के सभी अग्रिम समयों में पीछे छोड़ता है।

1-घंटे का रिज़ॉल्यूशन

प्रति दिन चार बार रिफ्रेश की गई घंटा-दर-घंटा भविष्यवाणियाँ — हम जिन क्षितिजों पर ट्रेड करते हैं उनके लिए GFS के 3 से 6 घंटे के मूल रिज़ॉल्यूशन से कहीं अधिक बारीक।

सैकड़ों परिदृश्य

एक मिनट से कम में सैकड़ों संभावित भविष्य का प्रोबेबिलिस्टिक एन्सेम्बल बनाता है, हमें एक वास्तविक वितरण देता है — एक एकल नियतात्मक अनुमान नहीं।

यह NOAA GFS से अधिक सटीक क्यों है

NOAA का Global Forecast System एक असाधारण इंजीनियरिंग है — लेकिन इसे डीप लर्निंग से पहले के युग में डिज़ाइन किया गया था, और भौतिकी-आधारित मॉडलिंग की सीमाएँ वर्षों से स्पष्ट हैं। एक कारण है कि ECMWF ने ऐतिहासिक रूप से GFS से लगभग पूरे एक दिन की पूर्वानुमान कुशलता में बेहतर प्रदर्शन किया है, और क्यों लगभग हर प्रमुख मौसम प्रदाता ने चुपचाप अपने पारंपरिक स्टैक के ऊपर AI लगाना शुरू किया है।

यहाँ WeatherNext 2 विशेष रूप से उन प्रकार के अल्प से मध्यम अवधि के तापमान पूर्वानुमानों पर GFS से आगे निकलता है जो Polymarket वेदर अनुबंधों को चलाते हैं:

  • सीखे गए वायुमंडलीय पैटर्न बनाम हल किए गए समीकरण — GFS वायुमंडल को एक ग्रिड में डिस्क्रीटाइज़ करके और प्रत्येक टाइमस्टेप पर Navier-Stokes हल करके अनुमानित करता है। ये अनुमान समय के साथ बढ़ते हैं। WeatherNext 2 ने ERA5 पुनर्विश्लेषण डेटा से वायुमंडल का पूर्ण नॉनलीनियर व्यवहार सीखा है, इसलिए यह उसी वर्ग की संख्यात्मक त्रुटि जमा नहीं करता।
  • नेटिव प्रोबेबिलिस्टिक आउटपुट — GFS आपको प्रति रन एक पूर्वानुमान देता है। वितरण प्राप्त करने के लिए आपको GEFS (एन्सेम्बल) चाहिए, जो लागत और विलंबता जोड़ता है। WeatherNext 2 पूर्ण वितरण नेटिव रूप से आउटपुट करता है, इसलिए हम वास्तविक संभावना देखते हैं कि एक शहर 14°C तक पहुँचता है, सिर्फ एक बिंदु अनुमान नहीं जिसे हमें खुद बायेसियन रूप से लपेटना पड़े।
  • उच्च प्रभावी रिज़ॉल्यूशन — WeatherNext 2 घंटे-दर-घंटे वैश्विक पूर्वानुमान तैयार करता है। GFS हमारी ट्रेडिंग रेंज के लिए 3-घंटे के आउटपुट के साथ 13km क्षैतिज रिज़ॉल्यूशन पर परिचालन रूप से चलता है। शहर-विशिष्ट दैनिक-अधिकतम और दैनिक-न्यूनतम कॉन्ट्रैक्ट्स के लिए, वह अतिरिक्त समय ग्रैन्युलैरिटी एक वास्तविक एज है।
  • टेल्स पर बेहतर — DeepMind के बेंचमार्क कम-संभावना, उच्च-प्रभाव वाली घटनाओं पर सबसे बड़ी बढ़त दिखाते हैं: कोल्ड स्नैप्स, हीट डोम्स, तूफान। ये बिल्कुल वही बाजार हैं जहाँ गलत-कीमत वाली पूंछ रहती है और जहाँ से हमारे सबसे बड़े ट्रेड आते हैं।
  • भौतिक रूप से सुसंगत एन्सेम्बल — FGN आर्किटेक्चर का मतलब है कि एनसेम्बल में हर परिदृश्य आंतरिक रूप से सुसंगत है (एक हवादार परिदृश्य में मेल खाने वाला दबाव ग्रेडिएंट भी होता है)। यही प्रायिकताओं को मूल्य निर्धारण के लिए उपयोग योग्य बनाता है।

Polymarket के अधिकांश मौसम बाज़ारों का गठन करने वाले 0-3 दिन क्षितिजों के लिए, स्वतंत्र मूल्यांकन आधुनिक AI मॉडलों को ECMWF के प्रमुख IFS के समान स्तर पर — और अक्सर उससे आगे — रखते हैं, जो स्वयं GFS से सार्थक रूप से आगे है। लगभग अनुवाद: 48 घंटे के निशान पर दैनिक अधिकतम तापमान पर कुछ दसवें डिग्री का RMSE, और दुर्लभ घटनाओं पर ध्यान देने योग्य रूप से कड़ी कैलिब्रेशन।

यह ट्रेड के परिणाम को क्यों बदलता है

StormBot का पूरा एज एक यांत्रिक चरण से आता है: किसी तापमान बकेट की वास्तविक संभावना का अनुमान Polymarket मार्केट की कीमत से अधिक सटीकता से लगाना। उसके बाद की हर चीज़ — Claude का YES/NO निर्णय, केली साइज़िंग, एग्ज़िट लॉजिक, ट्रेलिंग स्टॉप्स — सब उसी संभावना अनुमान पर निर्भर करती है।

आज हम GFS, ECMWF, UKMO, और NWS को एन्सेम्बल करते हैं, NCEI ऐतिहासिक जलवायुविज्ञान के साथ बायेसियन-ब्लेंड करते हैं, और संभावना तक पहुँचने के लिए पूर्वानुमान-त्रुटि वितरण पर सामान्य CDF लागू करते हैं। यह काम करता है। लेकिन यह मूल रूप से अंतर्निहित मॉडलों की सटीकता से सीमित है।

उस संभावना अनुमान को WeatherNext 2 के साथ प्राथमिक संकेत के रूप में बदलने के बहुत ठोस प्रभाव हैं:

  • तीव्र एज पहचान। पूर्वानुमान RMSE में आधा डिग्री का सुधार सीमारेखा वाले बाजारों पर 1-3% अधिक पता लगाने योग्य एज में सीधे अनुवाद होता है जो वर्तमान में हमारी 2% सीमा द्वारा फ़िल्टर किए जाते हैं। अधिक संकेत Claude तक पहुँचते हैं।
  • बेहतर कैलिब्रेशन। जब हम कहते हैं "YES की 78% संभावना," तो इसे एक बड़े नमूने पर वास्तव में 78% पर सुलझना चाहिए। WeatherNext 2 का नेटिव प्रोबेबिलिस्टिक आउटपुट किसी भी निर्धारक मॉडल से संश्लेषित किसी भी चीज़ की तुलना में काफ़ी बेहतर कैलिब्रेटेड है।
  • विनाशकारी टेल ट्रेड कम। दुर्लभ घटनाओं पर मॉडल का मजबूत प्रदर्शन इसका मतलब है कि हम मोटी पूँछों की गलत कीमत कम बार लगाते हैं — ऐतिहासिक रूप से अप्रत्याशित नुकसानों की हमारी सबसे बड़ी श्रेणी।
  • मॉडल टर्नअराउंड तेज़। हमारा वर्तमान पूर्वानुमान-फ़ेच चक्र रेट-सीमित मुफ्त वेदर APIs की लेटेंसी से बँधा है। WeatherNext 2 को Google Cloud के Vertex AI के माध्यम से चलाने का मतलब है कि हम पूर्वानुमानों को उनकी नहीं, बल्कि अपनी समय-सारिणी पर रिफ्रेश कर सकते हैं।

यह कठिन समस्या क्यों है

हम स्पष्ट रूप से कहना चाहते हैं: यह v2 के इन्फ्रास्ट्रक्चर माइग्रेशन के बाद से हमारे द्वारा लिया गया सबसे कठिन इंजीनियरिंग कार्य है। "एक नया मॉडल प्लग इन करना" कभी भी उतना सरल नहीं होता जितना लगता है, और विशेष रूप से WeatherNext 2 में कई तीखे किनारे हैं।

1
डेटा एक्सेस और प्लंबिंग
WeatherNext 2 के पूर्वानुमान Earth Engine, BigQuery, और Vertex AI के माध्यम से दिए जाते हैं। उनमें से कोई भी हमारे वर्तमान मुफ्त HTTP एंडपॉइंट्स का ड्रॉप-इन प्रतिस्थापन नहीं है। हमें ऑथ, कोटा प्रबंधन, लागत नियंत्रण और एक कैशिंग लेयर चाहिए जो 97+ सक्रिय शहर/तारीख कॉम्बो में भुगतान वाले इन्फ़रेंस कॉल को परिशोधित करे।
2
प्रोबेबिलिस्टिक आउटपुट एकीकरण
हमारा एज कैलकुलेटर एक एकल नियतात्मक बिंदु पूर्वानुमान और गाऊसी त्रुटि मॉडल के आसपास डिज़ाइन किया गया था। WeatherNext 2 हमें प्रति शहर सैकड़ों परिदृश्यों का पूर्ण एन्सेम्बल देता है। एज इंजन को वास्तविक अनुभवजन्य वितरण का उपभोग करने के लिए (नकली के बजाय) फिर से वायर करने के लिए इसके कोर को फिर से लिखने की आवश्यकता है: engine/edge.js और Claude द्वारा उपयोग किए जाने वाले हर थ्रेसहोल्ड को फिर से ट्यून करना।
3
शहर बिंदुओं पर ग्रिड इंटरपोलेशन
WeatherNext 2 एक वैश्विक ग्रिड आउटपुट देता है। Polymarket वेदर अनुबंध विशिष्ट नामित मौसम स्टेशनों पर सुलझते हैं (जैसे NYC के लिए LaGuardia, लंदन के लिए Heathrow)। हमें मॉडल के मूल ग्रिड से सटीक रिज़ॉल्यूशन स्टेशन तक सटीक बाइलीनियर या निकटतम-स्टेशन इंटरपोलेशन की आवश्यकता है — और फिर जहाँ प्रासंगिक हो स्थानीय माइक्रोक्लाइमेट प्रभावों के लिए डाउनस्केल।
4
प्रति पूर्वानुमान लागत
हम जो प्रत्येक शहर/तारीख संयोजन निगरानी करते हैं वह एक भुगतान वाला Vertex AI इन्फ़रेंस कॉल बन जाता है। ~97 अद्वितीय संयोजनों में ~1,975 सक्रिय वेदर मार्केटों के साथ, सरल कार्यान्वयन बजट को जल्दी खा जाएगा। हम एक स्तरीय रिफ्रेश रणनीति बना रहे हैं: उच्च-विश्वास बाज़ारों को बार-बार अपडेट मिलते हैं, कम वॉल्यूम वाले शहरों को धीमे चक्र मिलते हैं।
5
बैकवर्ड्स कम्पैटिबिलिटी
हम GFS/ECMWF/UKMO/NWS को नहीं हटा रहे हैं। अंतिम आर्किटेक्चर WeatherNext 2 को प्राथमिक संकेत के रूप में और पारंपरिक मॉडलों को सैनिटी चेक के रूप में उपयोग करता है। यदि WeatherNext 2 भौतिकी मॉडलों से तीव्र असहमत है, तो वह असहमति स्वयं एक फीचर बन जाती है जिस पर Claude तर्क कर सकता है — किसी भी पक्ष पर आँख मूँदकर भरोसा करने का कारण नहीं।
6
आउट-ऑफ-सैंपल वैलिडेशन
स्विच पलटने से पहले, हमें लाइव बॉट के मुकाबले WeatherNext 2 को हफ्तों के लिए शैडो-रन करना होगा — हर बाज़ार के लिए वह क्या भविष्यवाणी करता उसे लॉग करना, फिर वास्तव में क्या सुलझा उससे तुलना करना। एक मॉडल जो ERA5 पुनर्विश्लेषण पर बेहतरीन बेंचमार्क करता है, उसे फिर भी असली पैसे वाले प्रोडक्शन ट्रेडिंग लूप में अपनी जगह कमानी होगी।

अपेक्षित सटीकता सुधार

DeepMind के प्रकाशित बेंचमार्क और हमारे एज कैलकुलेटर के माध्यम से पूर्वानुमान त्रुटि कैसे फैलती है इसके हमारे अपने आंतरिक मॉडलिंग के आधार पर, इंटीग्रेशन लैंड होने के बाद हम StormBot के प्रदर्शन में यहाँ बदलाव की उम्मीद करते हैं:

तापमान RMSE (48 घंटे का होरिज़ोन)
−28%
2-दिन के निशान पर पूर्वानुमान त्रुटि में अपेक्षित कमी — वह क्षितिज जहाँ हमारे अधिकांश ट्रेड हल होते हैं।
प्रायिकता अंशांकन (Brier स्कोर)
+18%
बेहतर-कैलिब्रेटेड संभावनाओं का मतलब है कि Claude के कॉन्फिडेंस स्तर वास्तव में वास्तविकता से मेल खाते हैं, जो सीधे केली साइज़िंग में सुधार करता है।
टेल इवेंट सटीकता (अत्यधिक ठंड/गर्मी)
+40%
सबसे बड़ी बढ़त दुर्लभ घटनाओं पर है — बिल्कुल वहाँ जहाँ बाजार सबसे अधिक गलत मूल्य निर्धारित करते हैं और जहाँ हमारी सबसे बड़ी जीतें रहती हैं।
प्रति स्कैन पता लगाने योग्य edge
+35%
तीक्ष्णतर पूर्वानुमान अधिक मार्केट्स को हमारी 2% एज सीमा से ऊपर धकेलते हैं, Claude को मूल्यांकन के लिए अधिक उच्च-गुणवत्ता संकेत देते हैं।

पहुँच: वफादार उपयोगकर्ताओं के लिए वॉल्यूम-गेटेड

हमें यहाँ अर्थशास्त्र के बारे में ईमानदार रहना होगा। Vertex AI के माध्यम से WeatherNext 2 इन्फ़रेंस मुफ़्त नहीं है, और इंफ्रास्ट्रक्चर का काम महत्वपूर्ण इंजीनियरिंग निवेश का प्रतिनिधित्व करता है। हम इसे पहले ही दिन हर किसी को नहीं दे सकते — और स्पष्ट रूप से, हम देना नहीं चाहते। जिन यूज़र्स ने वास्तव में StormBot को आज जो है वह बनाया है, उन्हें ही इसे पहले मिलना चाहिए।

जब WeatherNext 2 लॉन्च होगा, तो एक्सेस होगा प्लेटफ़ॉर्म पर ट्रेडिंग वॉल्यूम के अनुसार सीमित. आपका संचयी ट्रेडिंग वॉल्यूम — pUSD का हर डॉलर जो आपने StormBot के माध्यम से Polymarket बाज़ारों में लगाया है — वह मुद्रा बन जाता है जो अपग्रेड किए गए इंजन को अनलॉक करती है। आपने जितना अधिक व्यापार किया है, उतना ही जल्दी और गहरा आपका एक्सेस।

वॉल्यूम टियर कैसे काम करेंगे

अंतिम टियर थ्रेशोल्ड लॉन्च के क़रीब घोषित किए जाएंगे, लेकिन संरचना तय कर दी गई है:

  • Tier 1 — फ़ाउंडर: उच्चतम संचयी वॉल्यूम समूह को क्लोज्ड अल्फा के दौरान WeatherNext 2 एक्सेस की पहली लहर मिलती है। पूर्ण एनसेम्बल आउटपुट, उच्चतम रिफ्रेश कैडेंस, इंजीनियरिंग टीम के लिए सीधा फीडबैक चैनल।
  • Tier 2 — पावर यूज़र्स: बीटा के दौरान दूसरी लहर। पूर्ण WeatherNext 2 सिग्नल, थोड़ी कम रिफ़्रेश दर के साथ।
  • Tier 3 — सक्रिय ट्रेडर्स: मौजूदा GFS/ECMWF/UKMO/NWS स्टैक के पूरक के रूप में WeatherNext 2 की सामान्य रोलआउट।
  • थ्रेशोल्ड से नीचे: वर्तमान मल्टी-मॉडल स्टैक पर जारी रहता है, जो पूरी तरह से समर्थित रहता है और स्वयं स्वतंत्र रूप से सुधारा जा रहा है।

आपका ट्रेडिंग वॉल्यूम स्वचालित रूप से ट्रैक होता है — बॉट आपकी ओर से जो प्रत्येक ट्रेड लगाता है वह गिना जाता है। आपको कुछ विशेष करने की आवश्यकता नहीं है। आप प्लेटफ़ॉर्म का जितना अधिक उपयोग करेंगे, आपका टियर उतना ही ऊँचा होगा।

निष्पक्षता पर एक त्वरित टिप्पणी: वॉल्यूम टियर आपके वॉलेट आकार से नहीं, बल्कि आपकी प्लेटफ़ॉर्म-पर ट्रेडिंग गतिविधि से गणना किए जाते हैं। एक छोटी बैंकरोल चलाने वाला लेकिन बॉट को लगातार ट्रेड करने देने वाला उपयोगकर्ता बड़ी बैलेंस जमा करके उसे निष्क्रिय छोड़ने वाले की तुलना में तेज़ी से टियर चढ़ेगा। यह जानबूझकर है — हम उन लोगों को पुरस्कृत करना चाहते हैं जो वास्तव में StormBot का उसी तरह उपयोग कर रहे हैं जैसे इसे उपयोग करने के लिए डिज़ाइन किया गया है।

समय-रेखा

सटीक तिथियों पर कोई वादे नहीं — यह गंभीर इंजीनियरिंग है, और हम इसे उत्पादन में जल्दबाजी नहीं करने वाले हैं। लेकिन यहाँ ईमानदार रोडमैप है:

  • अभी: Google Cloud खाता प्रोविजन किया गया, Vertex AI प्रारंभिक एक्सेस का अनुरोध किया गया, ऐतिहासिक डेटा के विरुद्ध शैडो-मोड प्रोटोटाइप का निर्माण किया जा रहा है।
  • अगले कुछ हफ़्ते: प्रायिकता समूहों को संभालने के लिए edge इंजन का रिफ़ैक्टर। मौजूदा इंजन के साथ समानांतर लॉगिंग।
  • अगले हफ़्ते: उत्पादन में शैडो रन — हर बाजार के लिए WeatherNext 2 भविष्यवाणियाँ लॉग की गईं, वास्तविक रिज़ॉल्यूशन के साथ तुलना की गई, यहाँ प्रकाशित कैलिब्रेशन रिपोर्ट के साथ।
  • बेंचमार्क पास होने के बाद: Tier 1 उपयोगकर्ताओं के लिए क्लोज़्ड अल्फ़ा। इंजीनियरिंग टीम के साथ फ़ीडबैक लूप। अंतिम ट्यूनिंग।
  • अल्फा के बाद: Tier 2 के बाद Tier 3 के माध्यम से चरणबद्ध रोलआउट।

आप अभी क्या कर सकते हैं

आपका ट्रेडिंग वॉल्यूम गिनना शुरू हो जाता है आज. इस क्षण से आगे StormBot आपकी ओर से जो भी ट्रेड करता है वह लॉन्च पर आपके WeatherNext 2 टियर की ओर गिना जाता है। सुनिश्चित करें कि आपका बॉट चल रहा है, आपका बैंकरोल कॉन्फ़िगर है, और आपका वॉलेट कनेक्ट है। हम आने वाले हफ्तों में सटीक वॉल्यूम थ्रेशोल्ड प्रकाशित करेंगे — लेकिन जो उपयोगकर्ता जल्दी लीडरबोर्ड पर चढ़ते हैं वही पहले अपग्रेड किए गए इंजन में कदम रखेंगे।

आगे पढ़ें

आसमान खेलने के दो नए तरीके: Storm Spin और Storm Bet अब लाइव हैं

लेख पढ़ें

हांगकांग लॉक: हमने शहर का पूर्वानुमान लगाना बंद किया और उसे पढ़ना शुरू किया

लेख पढ़ें

StormBot आंकड़ों में: 9,592 ट्रेडर, सदस्य लाभ में $2.87M, और इसे चलाने में ठीक कितना खर्च आता है

लेख पढ़ें
सभी लेख