Sarvam 2B: भारत का पहला Open-Source Indic AI Model, 10 भाषाओं में सपोर्ट

भारत में आर्टिफिशियल इंटेलिजेंस (AI) का भविष्य अब और तेज़ होने जा रहा है, क्योंकि Sarvam AI ने अपना नया भाषा मॉडल Sarvam 2B लॉन्च कर दिया है। यह भारत का पहला open-source Indic foundational model है, जिसे खासतौर पर भारतीय भाषाओं और स्थानीय जरूरतों को ध्यान में रखते हुए बनाया गया है। दुनिया के बड़े AI मॉडल्स की तुलना में Sarvam 2B अपेक्षाकृत हल्का है, लेकिन इसकी सबसे बड़ी खासियत यह है कि इसे पूरी तरह से पारदर्शी और डेवलपर्स के लिए खुला (open-source) रखा गया है।

Sarvam 2B मॉडल में लगभग 2 अरब पैरामीटर्स (2 Billion Parameters) हैं। ट्रेनिंग के लिए इसमें करीब 4 ट्रिलियन टोकन का डेटा इस्तेमाल किया गया है। इस डेटा का लगभग आधा हिस्सा भारतीय भाषाओं का है, जिसमें हिंदी, तमिल, तेलुगू, मलयालम, मराठी, कन्नड़, बंगाली, पंजाबी, ओड़िया और गुजराती जैसी प्रमुख Indic भाषाएँ शामिल हैं। इसका मतलब है कि यह मॉडल केवल अंग्रेज़ी पर निर्भर नहीं करता, बल्कि भारतीय भाषाओं में भी उतनी ही सहजता और सटीकता से जवाब देने में सक्षम है।

मॉडल का एक बड़ा फायदा यह है कि इसे open weights के साथ उपलब्ध कराया गया है। इसका मतलब है कि कोई भी शोधकर्ता, डेवलपर या स्टार्टअप इसे इस्तेमाल कर सकता है, अपनी ज़रूरत के हिसाब से fine-tune कर सकता है और अपने प्रोडक्ट या सर्विस में इंटीग्रेट कर सकता है। यह कदम भारत के AI इकोसिस्टम के लिए एक बड़ी उपलब्धि माना जा रहा है, क्योंकि इससे भाषा आधारित बाधाएँ काफी हद तक खत्म होंगी और छोटे व्यवसायों को भी AI की शक्ति इस्तेमाल करने का मौका मिलेगा।

Sarvam 2B का उपयोग केवल टेक्स्ट जनरेशन या चैटबॉट्स तक सीमित नहीं है। इसमें translation, summarization, content generation और conversational AI जैसी कई क्षमताएँ हैं। खास बात यह है कि Sarvam AI ने इसके साथ ही Samvaad-Hi-v1 नामक एक नया डेटासेट भी जारी किया है, जिसमें हिंदी, अंग्रेज़ी और हिंग्लिश संवाद शामिल हैं। यह conversational AI बनाने के लिए बेहद उपयोगी है, खासकर उन कंपनियों के लिए जो WhatsApp, Voice Bot या कस्टमर सपोर्ट जैसे क्षेत्रों में भारतीय भाषाओं का इस्तेमाल करना चाहती हैं।

AI मॉडल्स की सबसे बड़ी चुनौती होती है उनकी resource requirement। लेकिन Sarvam 2B का डिज़ाइन ऐसा रखा गया है कि यह अपेक्षाकृत छोटे और मिड-रेंज सेटअप्स पर भी अच्छे से काम कर सके। इसका मतलब है कि भारत में वे स्टार्टअप्स और संस्थान भी इसका लाभ उठा पाएंगे, जिनके पास बहुत बड़े GPU क्लस्टर या महंगे सर्वर नहीं हैं।

इस मॉडल के साथ Sarvam AI ने एक पूरा AI प्लेटफॉर्म भी तैयार किया है। इसमें voice-to-text, text-to-speech, translation, document parsing और AI agents जैसे फीचर्स शामिल हैं। इस वजह से यह केवल एक भाषा मॉडल नहीं बल्कि एक end-to-end solution बन जाता है।

कई टेक विशेषज्ञ मानते हैं कि Sarvam 2B का लॉन्च भारत में AI को mass adoption की दिशा में एक बड़ा कदम है। अब तक भारत में ज्यादातर AI टूल्स अंग्रेज़ी पर आधारित थे, लेकिन Sarvam 2B के बाद भारतीय भाषाओं में भी high-quality solutions संभव होंगे। यह कदम न केवल शिक्षा, हेल्थकेयर और गवर्नेंस में उपयोगी साबित हो सकता है बल्कि ग्रामीण भारत में भी डिजिटल समावेशन (digital inclusion) को गति देगा।

कुल मिलाकर Sarvam 2B भारत के AI परिदृश्य के लिए एक ऐतिहासिक लॉन्च है। यह भारत को global AI रेस में एक अलग पहचान दिलाने में मदद करेगा, क्योंकि दुनिया के बाकी देशों में अभी तक इतना व्यापक और विविध भारतीय भाषा-आधारित मॉडल उपलब्ध नहीं है।

Read Also