large language models

प्रारंभिक परीक्षा – बड़े भाषा मॉडल (large language models)
मुख्य परीक्षा- सामान्य अध्ययन, पेपर-3

चर्चा में क्यों

केंद्र सरकार के प्रधान वैज्ञानिक सलाहकार अजय सूद ने 18 अक्टूबर 2023 को कहा कि भारत बड़े भाषा मॉडल (LLM) के विकास का पता लगाने के लिए एक उच्चाधिकार प्राप्त समिति का गठन करेगा।

प्रमुख बिंदु

बड़े भाषा मॉडल(LLM) मानव को समझने और संसाधित करने वाले एप्लिकेशन बनाने के लिए कृत्रिम बुद्धिमत्ता का उपयोग करने वाले उपकरण हैं।
एलएलएम (LLM) एक आधारशिला तकनीक है जो कई 'बुद्धिमान' सॉफ़्टवेयर में अंतर्निहित है और चैटजीपीटी जैसे संभावित अनुप्रयोगों को बनाती है।
ऐसे एलएलएम (LLM) का पता लगाने के लिए और विशेष रूप से इसे भारतीय भाषाओं में कैसे लागू किया जा सकता है। इसके लिए एक उच्चाधिकार प्राप्त समिति की स्थापना की जा रही है।
भारत और संयुक्त राज्य अमेरिका दोनों देशों के बड़े भाषा मॉडल(LLM) तकनीकी पर सहयोग कर रहे है।

बड़े भाषा मॉडल (large language models)

एक बड़ा भाषा मॉडल (एलएलएम) एक गहन शिक्षण एल्गोरिदम है जो विभिन्न प्रकार के प्राकृतिक भाषा प्रसंस्करण (natural language processing) (NLP) का कार्य कर सकता है।
बड़े भाषा मॉडल ट्रांसफार्मर मॉडल का उपयोग करते हैं और बड़े पैमाने पर डेटासेट का उपयोग कर प्रशिक्षित होते हैं।
कई बड़े भाषा मॉडल विकसित किए गए हैं। जैसे OpenAI से GPT-3 और GPT-4, मेटा से LLaMA और Google से PaLM2 शामिल हैं।
ये ऐसे मॉडल भाषा समझ सकते हैं और टेक्स्ट जेनरेट कर सकते हैं तथा सामग्री को पहचानने, अनुवाद करने, भविष्यवाणी करने एवं उत्पन्न करने में सक्षम बनाता है।
बड़े भाषा मॉडल को तंत्रिका नेटवर्क (neural networks) (NNs), (एनएन) के रूप में भी जाना जाता है, जो मानव मस्तिष्क से प्रेरित कंप्यूटिंग सिस्टम हैं।
ये तंत्रिका नेटवर्क न्यूरॉन्स की तरह स्तरित नोड्स के नेटवर्क का उपयोग करके काम करते हैं।
शैक्षिक प्रौद्योगिकियों को विकसित करने के लिए बड़े भाषा मॉडल का तेजी से उपयोग किया जा रहा है जिसका उद्देश्य पाठ्य सामग्री के निर्माण और विश्लेषण को स्वचालित करना है जैसे स्वचालित प्रश्न निर्माण आदि ।
प्रौद्योगिकी, वित्त, स्वास्थ्य सेवा, ई-कॉमर्स और मीडिया सहित विभिन्न उद्योग बड़े भाषा मॉडल (एलएलएम) का लाभ उठाते हैं। Google, Microsoft, Amazon, Facebook, IBM और OpenAI जैसी कंपनियां एनएलपी, चैटबॉट्स, कंटेंट जेनरेशन, सेंटीमेंट एनालिसिस आदि जैसे अनुप्रयोगों के लिए एलएलएम का उपयोग करने वाले कुछ शीर्ष संगठन हैं।

प्रश्न: निम्नलिखित कथनों पर विचार कीजिए

बड़े भाषा मॉडल एक गहन शिक्षण एल्गोरिदम है जो विभिन्न प्रकार के प्राकृतिक भाषा प्रसंस्करण का कार्य कर सकता है।
बड़े भाषा मॉडल भाषा समझ सकते हैं और टेक्स्ट जेनरेट कर सकते हैं, सामग्री को पहचानने, अनुवाद करने, भविष्यवाणी करने एवं उत्पन्न करने में सक्षम बनाता है।
कई बड़े भाषा मॉडल विकसित किए गए हैं। जैसे OpenAI से GPT-3 और GPT-4, मेटा से LLaMA और Google से PaLM2 शामिल हैं।

उपर्युक्त में से कितने कथन सही हैं ?

(a) केवल एक

(b) केवल दो

(d) कोई भी नहीं

उत्तर: (c)

मुख्य परीक्षा प्रश्न :लार्ज लैंग्वेज मॉडल क्या है ? इसके प्रमुख विशेषताओं का उल्लेख कीजिए कीजिए।

स्रोत: the hindu

बड़े भाषा मॉडल (large language models)

More Articles

Have any Query?

+91-9555 124 124

Classroom Courses

Online/Live Courses

Test Series

Pendrive Courses

Other Courses

Other Links