New
UPSC GS Foundation (Prelims + Mains) Batch | Starting from : 20 May 2024, 11:30 AM | Call: 9555124124

 बड़े भाषा मॉडल (large language models)

प्रारंभिक परीक्षाबड़े भाषा मॉडल (large language models)
मुख्य परीक्षा- सामान्य अध्ययन, पेपर-3 

चर्चा में क्यों

केंद्र सरकार के प्रधान वैज्ञानिक सलाहकार अजय सूद ने 18 अक्टूबर 2023 को कहा कि भारत बड़े भाषा मॉडल (LLM) के विकास का पता लगाने के लिए एक उच्चाधिकार प्राप्त समिति का गठन करेगा।

chat-gpt

प्रमुख बिंदु 

  • बड़े भाषा मॉडल(LLM) मानव को समझने और संसाधित करने वाले एप्लिकेशन बनाने के लिए कृत्रिम बुद्धिमत्ता का उपयोग करने वाले उपकरण हैं।
  • एलएलएम (LLM) एक आधारशिला तकनीक है जो कई 'बुद्धिमान' सॉफ़्टवेयर में अंतर्निहित है और चैटजीपीटी जैसे संभावित अनुप्रयोगों को बनाती है।
  • ऐसे एलएलएम (LLM) का पता लगाने के लिए और विशेष रूप से इसे भारतीय भाषाओं में कैसे लागू किया जा सकता है इसके लिए एक उच्चाधिकार प्राप्त समिति की स्थापना की जा रही है।
  • भारत और संयुक्त राज्य अमेरिका दोनों देशों के बड़े भाषा मॉडल(LLM)  तकनीकी पर सहयोग कर रहे है।

  बड़े भाषा मॉडल (large language models)

  • एक बड़ा भाषा मॉडल (एलएलएम) एक गहन शिक्षण एल्गोरिदम है जो विभिन्न प्रकार के प्राकृतिक भाषा प्रसंस्करण (natural language processing) (NLP) का कार्य कर सकता है।
  • बड़े भाषा मॉडल ट्रांसफार्मर मॉडल का उपयोग करते हैं और बड़े पैमाने पर डेटासेट का उपयोग कर प्रशिक्षित होते हैं।
  • कई बड़े भाषा मॉडल विकसित किए गए हैं। जैसे OpenAI से GPT-3 और GPT-4, मेटा से LLaMA और Google से PaLM2 शामिल हैं।
  • ये ऐसे मॉडल भाषा समझ सकते हैं और टेक्स्ट जेनरेट कर सकते हैं तथा सामग्री को पहचानने, अनुवाद करने, भविष्यवाणी करने एवं उत्पन्न करने में सक्षम बनाता है।
  • बड़े भाषा मॉडल को तंत्रिका नेटवर्क (neural networks) (NNs), (एनएन) के रूप में भी जाना जाता है, जो मानव मस्तिष्क से प्रेरित कंप्यूटिंग सिस्टम हैं।
  • ये तंत्रिका नेटवर्क न्यूरॉन्स की तरह स्तरित नोड्स के नेटवर्क का उपयोग करके काम करते हैं।
  • शैक्षिक प्रौद्योगिकियों को विकसित करने के लिए बड़े भाषा मॉडल का तेजी से उपयोग किया जा रहा है जिसका उद्देश्य पाठ्य सामग्री के निर्माण और विश्लेषण को स्वचालित करना है जैसे स्वचालित प्रश्न निर्माण आदि ।
  • प्रौद्योगिकी, वित्त, स्वास्थ्य सेवा, ई-कॉमर्स और मीडिया सहित विभिन्न उद्योग बड़े भाषा मॉडल (एलएलएम) का लाभ उठाते हैं। Google, Microsoft, Amazon, Facebook, IBM और OpenAI जैसी कंपनियां एनएलपी, चैटबॉट्स, कंटेंट जेनरेशन, सेंटीमेंट एनालिसिस आदि जैसे अनुप्रयोगों के लिए एलएलएम का उपयोग करने वाले कुछ शीर्ष संगठन हैं।

प्रश्न: निम्नलिखित कथनों पर विचार कीजिए 

  1. बड़े भाषा मॉडल एक गहन शिक्षण एल्गोरिदम है जो विभिन्न प्रकार के प्राकृतिक भाषा प्रसंस्करण का कार्य कर सकता है।
  2. बड़े भाषा मॉडल भाषा समझ सकते हैं और टेक्स्ट जेनरेट कर सकते हैं, सामग्री को पहचानने, अनुवाद करने, भविष्यवाणी करने एवं उत्पन्न करने में सक्षम बनाता है।
  3. कई बड़े भाषा मॉडल विकसित किए गए हैं। जैसे OpenAI से GPT-3 और GPT-4, मेटा से LLaMA और Google से PaLM2 शामिल हैं।

उपर्युक्त में से कितने कथन सही हैं ?

 (a) केवल एक  

(b) केवल दो 

(c) सभी तीन  

(d) कोई भी नहीं 

उत्तर: (c)

मुख्य परीक्षा प्रश्न :लार्ज लैंग्वेज मॉडल क्या है ? इसके प्रमुख विशेषताओं का उल्लेख कीजिए कीजिए

 
स्रोत: the hindu
Have any Query?

Our support team will be happy to assist you!

OR