भारत में आर्टिफिशियल इंटेलिजेंस के क्षेत्र में आत्मनिर्भरता की चर्चा तेज हो रही है। इसी बीच भारतीय स्टार्टअप Sarvam AI ने दावा किया है कि उसका AI मॉडल कुछ मामलों में OpenAI के ChatGPT और Google के Gemini से बेहतर प्रदर्शन कर रहा है। कंपनी के CEO प्रत्युष कुमार ने एक बेंचमार्क टेस्ट का हवाला देते हुए यह दावा सार्वजनिक किया है।
OmniDocBench टेस्ट में ऊंचा स्कोर
Sarvam AI के अनुसार, उसके विज़ुअल-लैंग्वेज मॉडल Sarvam Vision ने OmniDocBench v1.5 नामक बेंचमार्क में 93% से अधिक स्कोर हासिल किया। यह टेस्ट AI सिस्टम की जटिल डॉक्यूमेंट समझने की क्षमता को परखता है — जैसे कठिन फॉन्ट, हस्तलिखित टेक्स्ट और विभिन्न फॉर्मेट में मौजूद डाटा को पहचानना।
कंपनी का कहना है कि इस टेस्ट में Sarvam Vision का स्कोर 93.28% रहा, जो ChatGPT और Gemini के स्कोर से अधिक है।
क्या सच में ChatGPT से बेहतर है?
यह सवाल स्वाभाविक है कि क्या Sarvam AI वास्तव में ChatGPT या Gemini से बेहतर है। इसका जवाब थोड़ा संतुलित नजरिए से समझना जरूरी है।
OpenAI और Google के मॉडल बेहद बड़े पैमाने पर तैयार किए गए हैं। इनमें ट्रिलियन स्तर तक के पैरामीटर शामिल हैं, जो उन्हें बहु-उद्देश्यीय (multi-purpose) बनाते हैं। वे टेक्स्ट, इमेज, कोडिंग, लॉजिकल रीजनिंग और कई जटिल कार्यों को संभालने में सक्षम हैं।
वहीं Sarvam AI का मॉडल लगभग 3 बिलियन पैरामीटर पर आधारित बताया जाता है और इसे खासतौर पर भारतीय भाषाओं और लिपियों पर केंद्रित करके तैयार किया गया है। इसका मतलब यह है कि यह विशेष रूप से भारतीय संदर्भ में दस्तावेज़ पहचान और विज़ुअल-टेक्स्ट समझ जैसे कामों में बेहतर परिणाम दे सकता है।
‘मेड इन इंडिया’ फोकस बना ताकत
Sarvam Vision एक विज़ुअल लैंग्वेज मॉडल है, जो इमेज को समझ सकता है और उसमें मौजूद टेक्स्ट या जानकारी को पहचानकर उसका विश्लेषण कर सकता है। चूंकि इसे भारतीय भाषाओं पर ट्रेन किया गया है, इसलिए देवनागरी, क्षेत्रीय लिपियों और विविध फॉर्मेट वाले दस्तावेज़ों को समझने में इसे बढ़त मिल सकती है।
यह वही क्षेत्र है जहां वैश्विक मॉडल कभी-कभी स्थानीय भाषाई जटिलताओं के कारण कमजोर पड़ सकते हैं।
सीमाएं और संभावनाएं
हालांकि Sarvam AI का प्रदर्शन खास बेंचमार्क में प्रभावशाली बताया जा रहा है, लेकिन यह जरूरी नहीं कि वह हर क्षेत्र में ChatGPT या Gemini से बेहतर हो। बड़े मॉडल व्यापक उपयोग के लिए बनाए जाते हैं, जबकि Sarvam AI अधिक केंद्रित और विशिष्ट उपयोग मामलों पर आधारित है।
फिर भी, यह उपलब्धि इस बात का संकेत है कि भारतीय स्टार्टअप अब वैश्विक AI कंपनियों को चुनौती देने की स्थिति में पहुंच रहे हैं। Sarvam का टेक्स्ट-टू-स्पीच मॉडल Bulbul V3 भी इसी दिशा में एक और कदम माना जा रहा है।
आगे क्या?
अगर भारतीय कंपनियां स्थानीय जरूरतों को ध्यान में रखते हुए ऐसे ही केंद्रित और कुशल AI मॉडल बनाती रहीं, तो आने वाले समय में देश AI टेक्नोलॉजी के क्षेत्र में मजबूत वैश्विक उपस्थिति दर्ज करा सकता है।
Sarvam AI का दावा सिर्फ एक तकनीकी उपलब्धि नहीं, बल्कि यह संकेत भी है कि भारत अब AI की दौड़ में केवल उपभोक्ता नहीं, बल्कि निर्माता की भूमिका में भी आगे बढ़ रहा है।









