बेंगलुरु स्थित एआई स्टार्टअप सर्वम ए.आई. (Sarvam AI) ने अपना नवीनतम टेक्स्ट-टू-स्पीच (TTS) मॉडल ‘बुलबुल-वी2 (Bulbul-v2)’ लॉन्च किया है।
Bulbul-v2 की प्रमुख विशेषताएँ
- लॉन्च : एआई स्टार्टअप Sarvam AI द्वारा
- 11 भारतीय भाषाओं का समर्थन : हिंदी, मराठी, बांग्ला, गुजराती, तमिल, तेलुगु, कन्नड़, पंजाबी, मलयालम, उर्दू एवं ओड़िया
- क्षेत्रीय उच्चारणों के साथ रीयल-टाइम सिंथेसिस : क्षेत्रीय उच्चारणों के साथ स्पष्ट एवं स्वाभाविक आवाज़
- मल्टी-लैंग्वेज (कोड-मिक्स्ड) सपोर्ट : एक ही टेक्स्ट में विभिन्न भाषाओं का मिश्रण
- ध्वनि पर सटीक नियंत्रण : पिच, गति एवं आवाज़ की तीव्रता पर नियंत्रण
- विभिन्न सैंपल रेट : 8kHz से 24kHz तक के विकल्प
- स्मार्ट टेक्स्ट प्री-प्रोसेसिंग : संख्याएँ, तिथियाँ एवं मिश्रित भाषा वाले कंटेंट को सामान्यीकृत करता है।
पृष्ठभूमि
- Bulbul-v1 को अगस्त 2024 में लॉन्च किया गया था।
- इसमें 6 प्रीसेट वॉइस पर्सनैलिटी थीं।
- Sarvam AI पहला भारतीय स्टार्टअप है जिसे स्वदेशी लैंग्वेज मॉडल (LLM) विकसित करने के लिए चुना गया।
- इसमें तर्कशीलता (Reasoning) और वॉइस क्षमताएँ शामिल हैं।
महत्त्व
- स्थानीय भाषाओं में डिजिटल सेवाओं की पहुँच : भारत में डिजिटल सेवाओं की पहुँच को आसान बनाता है।
- ब्रांडों के लिए प्रामाणिक आवाज़ : ब्रांडों को स्थानीय और क्षेत्रीय दर्शकों तक पहुँचने में मदद करता है।
- भारत के AI इकोसिस्टम को सशक्त बनाना : भारत के AI क्षेत्र को आत्मनिर्भर एवं तकनीकी रूप से सशक्त बनाने में मदद करता है।