Track
Google ने 19 मई को I/O 2026 में जेमिनी 3.5 फ्लैश की घोषणा की, एक ऐसा मॉडल जो एजेंटिक और कोडिंग बेंचमार्क पर जेमिनी 3.1 प्रो को मात देता है, जबकि उसी श्रेणी के अन्य फ्रंटियर मॉडलों की तुलना में चार गुना तेज़ चलता है।
यह रिलीज़ ऐसे समय में आई है जब AI उद्योग का प्रतिस्पर्धी फोकस स्पष्ट रूप से एजेंटिक प्रदर्शन की ओर शिफ्ट हो गया है। कोडिंग एजेंट, मल्टी-स्टेप वर्कफ़्लो ऑटोमेशन, और लॉन्ग-होराइजन टास्क निष्पादन मुख्य मैदान बन गए हैं, और Google 3.5 फ्लैश को उस आवश्यक क्षण के जवाब के रूप में पेश कर रहा है।
डेटा वैज्ञानिकों, ML इंजीनियरों और डेवलपर्स सहित सभी तरह के पेशेवरों के लिए यह अहम है क्योंकि 3.5 फ्लैश अब (या बहुत जल्द) जेमिनी ऐप और सर्च के AI मोड में डिफ़ॉल्ट मॉडल है, और आज जेमिनी API के माध्यम से उपलब्ध है। इस लेख में, मैं बताऊँगा क्या घोषित हुआ, क्या प्रमुख है, बेंचमार्क नंबर क्या हैं, और इसका आपके काम पर क्या मतलब है।
जेमिनी 3.5 फ्लैश में नया क्या है
जेमिनी 3.5 फ्लैश का हेडलाइन दावा है गति के साथ फ्रंटियर-स्तरीय प्रदर्शन। Google का कहना है कि 3.5 फ्लैश आउटपुट टोकन्स प्रति सेकंड में अन्य फ्रंटियर मॉडलों से चार गुना तेज़ है, जबकि एजेंटिक कार्य के लिए सबसे महत्वपूर्ण बेंचमार्क पर जेमिनी 3.1 प्रो से बेहतर प्रदर्शन करता है।
टर्मिनल-बेंच 2.1 पर, यह 76.2% स्कोर करता है। GDPval-AA पर, यह 1,656 Elo तक पहुँचता है। MCP Atlas पर, यह 83.6% हिट करता है। मल्टीमॉडल अंडरस्टैंडिंग के लिए, यह CharXiv Reasoning पर 84.2% स्कोर करता है।
संक्षेप में, ये नंबर दिखाते हैं कि AI में पुराना नियम ‘तेज़, सस्ता, या स्मार्ट; दो चुनें’ अब कम लागू होता है। हमें एक हल्का मॉडल मिल रहा है जो बड़े लेटेंसी के बिना जटिल, मल्टी-स्टेप एजेंट वर्कफ़्लो संभाल सकता है।
Google का कहना है कि मॉडल आज से Google AI Studio, जेमिनी API, Android Studio, जेमिनी एंटरप्राइज एजेंट प्लेटफ़ॉर्म और जेमिनी एंटरप्राइज में व्यापक रूप से उपलब्ध होगा। यह जेमिनी ऐप और सर्च के AI मोड में वैश्विक स्तर पर नया डिफ़ॉल्ट मॉडल भी है।
Google ने यह भी घोषणा की कि जेमिनी 3.5 प्रो विकास में है, पहले से आंतरिक उपयोग में है, और अगले महीने रोल आउट होने की उम्मीद है। 3.5 फ्लैश रिलीज़ एजेंटिक निष्पादन पर आधारित एक नए मॉडल परिवार की शुरुआती चाल है।
जेमिनी 3.5 की पृष्ठभूमि
जेमिनी 3 सीरीज़ ने फ्रंटियर मॉडल रेस में Google की मौजूदा स्थिति स्थापित की। फरवरी 2026 में जारी जेमिनी 3.1 प्रो ने लॉन्च के समय आर्टिफ़िशियल एनालिसिस इंटेलिजेंस इंडेक्स में बढ़त बनाई और ARC-AGI-2 पर 77.1% स्कोर किया, जो उसी बेंचमार्क पर जेमिनी 3 प्रो के 31.1% का दोगुने से अधिक था।
जैसा कि हमने अपने GPT-5.5 बनाम जेमिनी 3.1 प्रो तुलना में कवर किया, जेमिनी 3.1 प्रो की ताकत जटिल विज़ुअल रीजनिंग और मल्टीमॉडल कार्यों में थी।
जेमिनी परिवार में फ्लैश नामकरण परंपरा हमेशा स्पीड-ऑप्टिमाइज़्ड मॉडलों का संकेत रही है। 3.5 फ्लैश में अलग यह है कि Google फ्लैश स्पीड पर फ्रंटियर-स्तरीय इंटेलिजेंस का दावा कर रहा है, न कि गुणवत्ता में किसी समझौते का। आर्टिफ़िशियल एनालिसिस इंडेक्स 3.5 फ्लैश को टॉप-राइट क्वाड्रंट में रखता है (Google के अनुसार), यानी एक साथ उच्च इंटेलिजेंस और उच्च आउटपुट स्पीड।
Antigravity हार्नेस, सहयोगी सबएजेंट्स को डिप्लॉय करने के लिए Google का फ्रेमवर्क, 3.5 फ्लैश की पोज़िशनिंग के केंद्र में है। यह सिर्फ एक स्टैंडअलोन मॉडल नहीं है, बल्कि एक मल्टी-एजेंट आर्किटेक्चर का घटक है जिसे Google मॉडल के साथ-साथ बना रहा है।
जेमिनी 3.5 की प्रमुख विशेषताएँ
घोषणा से मिली सबसे दिलचस्प जानकारी का सार नीचे है।
बेंचमार्क प्रदर्शन
3.5 फ्लैश के लिए Google के बेंचमार्क दावे विशिष्ट हैं और सीधे देखने लायक हैं। मॉडल निम्न बिंदुओं पर जेमिनी 3.1 प्रो से बेहतर है:
- टर्मिनल-बेंच 2.1: 76.2% (हमारी पूर्व कवरेज के अनुसार जेमिनी 3.1 प्रो को टर्मिनल-बेंच 2.0 पर 68.5% पर बेंचमार्क किया गया था)
- GDPval-AA: 1,656 Elo (क्लॉड ओपस 4.7 ने लॉन्च के समय इस बेंचमार्क में 1,753 Elo के साथ बढ़त बनाई थी, जैसा कि हमारे क्लॉड ओपस 4.7 बनाम जेमिनी 3.1 प्रो रिव्यू में है)
- MCP Atlas: 83.6% (हमारे पूर्व परीक्षण में जेमिनी 3.1 प्रो ने MCP Atlas पर 73.9% स्कोर किया)
- CharXiv Reasoning: मल्टीमॉडल अंडरस्टैंडिंग के लिए 84.2%
स्पीड का दावा भी उल्लेखनीय है: आउटपुट टोकन्स प्रति सेकंड में अन्य फ्रंटियर मॉडलों से चार गुना तेज़। Google शोध नोट्स में यह निर्दिष्ट नहीं करता कि वह किन मॉडलों से तुलना कर रहा है, इसलिए उस आंकड़े को सटीक हेड-टू-हेड के बजाय दिशात्मक मानें।
एजेंटिक आर्किटेक्चर और Antigravity
3.5 फ्लैश को Antigravity हार्नेस के साथ काम करने के लिए डिज़ाइन किया गया है, जो सहयोगी सबएजेंट्स चलाने के लिए Google का फ्रेमवर्क है। Antigravity के साथ, मॉडल समानांतर में कई सबएजेंट्स डिप्लॉय कर सकता है, मल्टी-स्टेप वर्कफ़्लोज़ निष्पादित कर सकता है, और लॉन्ग-होराइजन टास्क में प्रदर्शन बनाए रख सकता है।
Google के उदाहरणों में AlphaZero पेपर का सिंथेसिस करना और दो एजेंट्स का उपयोग करके छह घंटों में एक पूरी तरह खेलने योग्य गेम कोड करना, और एक लेगेसी कोडबेस को Next.js में ट्रांसफॉर्म करना शामिल है। ये खिलौना डेमो नहीं हैं। ये उन तरह के मल्टी-डे डेवलपर कार्यों को दर्शाते हैं जिन्हें अब एजेंटिक सिस्टम्स से संभालने को कहा जा रहा है।
वास्तविक-world एंटरप्राइज़ डिप्लॉयमेंट
कई एंटरप्राइज़ पहले से ही 3.5 फ्लैश को प्रोडक्शन या पायलट में चला रहे हैं। विशेष उपयोग मामलों पर ध्यान देना उपयोगी है क्योंकि वे दिखाते हैं कि मॉडल की एजेंटिक क्षमताएँ कहाँ लागू हो रही हैं:
- Shopify: व्यापारी विकास पूर्वानुमानों के लिए लंबे समय तक जटिल डेटा का विश्लेषण करने हेतु समानांतर में सबएजेंट्स चलाना
- Macquarie Bank: 100+ पृष्ठों वाले दस्तावेज़ों पर कम लेटेंसी के साथ रीजनिंग करके ग्राहक ऑनबोर्डिंग का पायलट
- Salesforce: मल्टी-सबएजेंट एंटरप्राइज़ टास्क ऑटोमेशन के लिए मल्टी-टर्न टूल कॉलिंग के साथ Agentforce में एकीकरण
- Xero: मल्टी-वीक वर्कफ़्लोज़ प्रबंधित करने के लिए एजेंट्स डिप्लॉय करना, जिनमें छोटे व्यवसायों के लिए 1099 टैक्स फ़ॉर्म तैयारी शामिल है
- Databricks: बड़े डेटासेट्स में रीयल-टाइम जानकारी मॉनिटर करने, समस्याओं का निदान करने, और समाधान प्रस्तावित करने हेतु एजेंटिक वर्कफ़्लोज़ का उपयोग
- Ramp: मल्टीमॉडल अंडरस्टैंडिंग और ऐतिहासिक पैटर्न पर रीजनिंग को मिलाकर जटिल इनवॉयसेज़ पर OCR सटीकता में सुधार
जेमिनी स्पार्क और उपभोक्ता उपलब्धता
3.5 फ्लैश जेमिनी स्पार्क को भी पावर करता है, Google का नया पर्सनल AI एजेंट जो 24/7 चलता है और उपयोगकर्ताओं की ओर से कार्रवाई करता है। Google अभी स्पार्क को भरोसेमंद टेस्टर्स के लिए रोल आउट कर रहा है, और I/O घोषणा के अगले सप्ताह US में Google AI Ultra सब्सक्राइबर्स के लिए बीटा की योजना है।
मॉडल आज जेमिनी ऐप और सर्च के AI मोड के माध्यम से वैश्विक स्तर पर अरबों उपयोगकर्ताओं के लिए उपलब्ध है, जिससे यह जेमिनी मॉडल के लिए Google द्वारा किए गए सबसे व्यापक समवर्ती उपभोक्ता और डेवलपर लॉन्च में से एक बनता है।
सुरक्षा और सेफ़गार्ड्स
Google का कहना है कि 3.5 फ्लैश को उसके फ्रंटियर सेफ़्टी फ्रेमवर्क के तहत विकसित किया गया है, जिसमें साइबर और CBRN सेफ़गार्ड्स को मज़बूत किया गया है। कंपनी ऐसे इंटरप्रेटेबिलिटी टूल्स का उपयोग कर रही है जो मॉडल के प्रतिक्रिया देने से पहले उसके आंतरिक तर्क की जाँच करते हैं, जिसका उद्देश्य हानिकारक आउटपुट और सुरक्षित क्वेरीज़ पर ग़लत रिफ्यूज़ल्स—दोनों—को कम करना है।
डेटा और AI प्रैक्टिशनर्स के लिए जेमिनी 3.5
सबसे तात्कालिक व्यावहारिक असर यह है कि 3.5 फ्लैश Google AI Studio में जेमिनी API के माध्यम से शीघ्र उपलब्ध है। यदि आप एजेंटिक पाइपलाइन्स बना रहे हैं, तो MCP Atlas स्कोर (83.6%) और Antigravity मल्टी-एजेंट हार्नेस का संयोजन इसे आपके मौजूदा समाधान के खिलाफ टेस्ट करने लायक बनाता है।
1,656 Elo का GDPval-AA स्कोर हमारे पहले के रिव्यू में क्लॉड ओपस 4.7 के 1,753 Elo से पीछे है, लेकिन 3.5 फ्लैश का स्पीड एडवांटेज आपकी लेटेंसी आवश्यकताओं पर निर्भर करते हुए अधिक मायने रख सकता है।
लॉन्ग-होराइजन वर्कफ़्लोज़ चलाने वाली टीमों के लिए, Xero और Shopify डिप्लॉयमेंट सबसे शिक्षाप्रद संकेत हैं। मल्टी-वीक वर्कफ़्लोज़ का स्वचालित एजेंट रन में संपीड़न वह उपयोग मामला है जिसके लिए Google ऑप्टिमाइज़ कर रहा है, और Antigravity हार्नेस वह इंफ्रास्ट्रक्चर लेयर है जो इसे संभव बनाती है। यदि आप पहले से मल्टी-एजेंट ऑर्केस्ट्रेशन पैटर्न से परिचित नहीं हैं, तो यह गति पकड़ने का अच्छा समय है।
एक बात जिस पर मैं करीबी नज़र रखूँगा: Google का कहना है कि 3.5 फ्लैश समान कार्यों के लिए अन्य फ्रंटियर मॉडलों की कीमत के आधे से भी कम लागत आती है। यह दावा आपके विशिष्ट वर्कलोड पर बहुत निर्भर करता है, लेकिन यदि यह व्यवहार में सही ठहरता है, तो बड़े पैमाने पर एजेंटिक सिस्टम चलाने की अर्थव्यवस्था बदल जाती है। अगले महीने आने वाला 3.5 प्रो मॉडल उन टीमों के लिए और भी दिलचस्प तुलना बिंदु होगा जो सबसे भारी रीजनिंग कार्य करती हैं।
अंतिम विचार
जेमिनी 3.5 फ्लैश दिखाता है कि Google प्रदर्शन-गति कर्व के दोनों सिरों पर प्रतिस्पर्धा करना चाहता है, केवल फ़्लैगशिप स्तर पर नहीं। एजेंटिक बेंचमार्क पर जेमिनी 3.1 प्रो को पछाड़ते हुए फ्लैश स्पीड पर चलना एक सार्थक बदलाव है, और Shopify, Macquarie, और Salesforce में एंटरप्राइज़ डिप्लॉयमेंट संकेत देते हैं कि मॉडल नियंत्रित बेंचमार्क्स के बाहर भी टिकता है।
बड़ी तस्वीर यह है कि Google एजेंटिक इंफ्रास्ट्रक्चर पर बड़ा दांव लगा रहा है—Antigravity, जेमिनी स्पार्क, और 3.5 फ्लैश—तीनों एक ही दिशा में इशारा करते हैं। यह दांव कितना सफल होता है, यह इस पर निर्भर करेगा कि अगले महीने आने पर 3.5 प्रो कैसा प्रदर्शन करता है, और वास्तविक डेवलपर वर्कफ़्लोज़ में Antigravity हार्नेस प्रतिस्पर्धी मल्टी-एजेंट फ्रेमवर्क्स की तुलना में कैसा ठहरता है।
यदि आप एजेंटिक AI अवधारणाओं और ऐसे मॉडलों के साथ निर्माण करना सीखना चाहते हैं, तो मैं DataCamp पर AI Agent Fundamentals स्किल ट्रैक देखने की सलाह देता हूँ।