(प्रारंभिक परीक्षा: राष्ट्रीय महत्त्व की सामयिक घटनाएँ, सामान्य विज्ञान) (मुख्य परीक्षा, सामान्य अध्ययन प्रश्नपत्र- 3: विज्ञान एवं प्रौद्योगिकी में भारतीयों की उपलब्धियाँ; देशज रूप से प्रौद्योगिकी का विकास और नई प्रौद्योगिकी का विकास, सूचना प्रौद्योगिकी, अंतरिक्ष, कंप्यूटर, रोबोटिक्स, नैनो-टैक्नोलॉजी, बायो-टैक्नोलॉजी) |
संदर्भ
हाल ही में जारी एक सरकारी कार्यपत्र में सुझाव दिया गया है कि चैटजीपीटी (ChatGPT) जैसे एआई लार्ज लैंग्वेज मॉडल (AI LLMs) को ऑनलाइन स्वतंत्र रूप से उपलब्ध सामग्री तक डिफ़ॉल्ट रूप से पहुँच होनी चाहिए और प्रकाशकों के पास ऐसी सामग्री के लिए ऑप्ट-आउट (opt-out) तंत्र नहीं होना चाहिए।
लार्ज लैंग्वेज मॉडल्स (LLMs) के बारे में
- एल.एल.एम. एक प्रकार का कृत्रिम बुद्धिमत्ता (AI) प्रोग्राम है जो अन्य कार्यों के अलावा टेक्स्ट को पहचान सकता है और उत्पन्न कर सकता है। एल.एल.एम. को विशाल डेटा सेट्स पर प्रशिक्षित किया जाता है और इसीलिए इसका नाम ‘लार्ज’ है।
- एल.एल.एम. मशीन लर्निंग पर आधारित है जिसमें विशेष रूप से एक प्रकार का न्यूरल नेटवर्क शामिल है जिसे ‘ट्रांसफॉर्मर मॉडल’ कहा जाता है जो शब्दों के अनुक्रमों को संभालने और टेक्स्ट में पैटर्न को पकड़ने में उत्कृष्ट है।
- सरल शब्दों में एल.एल.एम. एक कंप्यूटर प्रोग्राम है जिसमें मानव भाषा या अन्य प्रकार के जटिल डाटा की पहचान करने और व्याख्या करने में सक्षम होने के लिए पर्याप्त उदाहरण दिए गए हैं।
- कई एल.एल.एम. इंटरनेट से एकत्रित किए गए डाटा पर प्रशिक्षित किया जाता है जिसमें हजारों या लाखों गीगाबाइट के बराबर टेक्स्ट डेटा शामिल है।
- हालाँकि, नमूनों (Samples) की गुणवत्ता इस बात पर प्रभाव डालती है कि एल.एल.एम. प्राकृतिक भाषा को कितनी अच्छी तरह सीखता है, इसलिए एल.एल.एम. के प्रोग्रामर अधिक सुनियोजित डेटा सेट का उपयोग कर सकते हैं।
- एल.एल.एम. एक प्रकार की मशीन लर्निंग का उपयोग करते हैं जिसे ‘डीप लर्निंग’ कहा जाता है ताकि यह समझा जा सके कि अक्षर, शब्द व वाक्य एक साथ कैसे कार्य करते हैं।
- ‘डीप लर्निंग’ में असंरचित डेटा का संभाव्यता विश्लेषण (Probabilistic Analysis) शामिल होता है जो अंततः डीप लर्निंग मॉडल को मानवीय हस्तक्षेप के बिना कंटेंट के अंश के बीच अंतर (विशिष्टता) को पहचानने में सक्षम बनाता है।
- इसके बाद एल.एल.एम. को ट्यूनिंग (Tuning) के माध्यम से अधिक प्रशिक्षित किया जाता है और उन्हें उस विशेष कार्य के लिए ‘फाइन-ट्यून’ (Fine-tuned) या ‘प्रॉम्प्ट-ट्यून’ (Prompt-tuned) किया जाता है जिसे प्रोग्रामर उनसे करवाना चाहता है।
लार्ज लैंग्वेज मॉडल के उपयोग
- एल.एल.एम. भाषा संबंधी विभिन्न कार्य कर सकते हैं, जैसे- प्रश्नों के उत्तर देना, टेक्स्ट का सारांश बनाना, भाषाओं का अनुवाद करना और कंटेंट तैयार करना।
- व्यवसायों में एल.एल.एम.-आधारित अनुप्रयोगों का उपयोग कर्मचारियों की उत्पादकता और दक्षता में सुधार करने, ग्राहकों को व्यक्तिगत अनुशंसाएँ प्रदान करने तथा विचार-मंथन, नवाचार व उत्पाद विकास में तेजी लाने के लिए करते हैं।
- LLM आज के सर्वाधिक उपयोग किए जाने वाले टेक्स्ट-केंद्रित जनरेटिव AI (GenAI) टूल्स, जैसे- ChatGPT, Claude, Microsoft Copilot, Gemini एवं Meta AI के पीछे मूलभूत शक्ति के रूप में कार्य करते हैं।
- चूँकि एल.एल.एम. अब मल्टीमॉडल (टेक्स्ट के अलावा अन्य मीडिया प्रकारों के साथ कार्य करना) बन रहे हैं, इसलिए उन्हें अब ‘फाउंडेशन मॉडल’ भी कहा जाता है।
- हालाँकि, ये अभूतपूर्व कार्यक्रम हैं, फिर भी एल.एल.एम. को कई चुनौतियों का सामना करना पड़ता है जिनमें गणना संबंधी आवश्यकताएँ, नैतिक चिंताएँ एवं संदर्भ को समझने संबंधी सीमाएँ शामिल हो सकती हैं।
कुछ प्रमुख परिभाषिक शब्दावली
- मशीन लर्निंग: कृत्रिम बुद्धिमत्ता का एक उपसमूह है जिसमें डेटा को एक प्रोग्राम में फीड किया जाता है ताकि वह उस डेटा में मौजूद विशेषताओं की पहचान कर सके।
- डीप लर्निंग: यह मानवीय हस्तक्षेप के बिना पैटर्न को पहचानने के लिए स्वयं को प्रशिक्षित करती है।
- न्यूरल नेटवर्क: यह कई लेयर्स से बने आपस में जुड़े नेटवर्क नोड्स से निर्मित होता है जो एक-दूसरे के बीच सूचना का आदान-प्रदान करते हैं।
- ट्रांसफॉर्मर मॉडल: अनुक्रम (Sequence) में एलिमेंट्स के बीच संबंध का पता लगाने के लिए सेल्फ-अटेंशन नामक तकनीक का उपयोग करके संदर्भ (Context) सीखते हैं।