New
UPSC GS Foundation (Prelims + Mains) Batch | Starting from : 20 May 2024, 11:30 AM | Call: 9555124124

मल्टीमॉडल आर्टिफिशियल इंटेलिजेंस (multimodal artificial intelligence)

प्रारंभिक परीक्षा – मल्टीमॉडल आर्टिफिशियल इंटेलिजेंस
मुख्य परीक्षा- सामान्य अध्ययन, पेपर-3

संदर्भ 

हाल ही में एक रिपोर्ट में यह कहा गया है कि Google को अपने खोज इंजन और YouTube के माध्यम से छवियों और वीडियो के आसानी से उपलब्ध बैंक के कारण मल्टीमॉडल दुनिया में प्रतिस्पर्धियों पर आसान बढ़त हासिल है।

artificial-intelligence

मल्टीमॉडल एआई क्या है?

  • मल्टीमॉडल एआई ऐसी  कृत्रिम बुद्धिमत्ता है जो अधिक सटीक व्यावहारिक निष्कर्ष निकालने एवं दुनिया की समस्याओं के बारे में सटीक भविष्यवाणियां करने के लिए डेटा के कई प्रकारों का इस्तेमाल करता है। 
  • मल्टीमॉडल एआई सिस्टम में वीडियो, ऑडियो, भाषण, चित्र, संख्यात्मक डेटा सेट की एक श्रृंखला के साथ प्रशिक्षण और उपयोग करते हैं।
  •  मल्टीमॉडल एआई में सामग्री और संदर्भ की बेहतर व्याख्या करने के लिए कई डेटा प्रकारों का उपयोग किया जाता है जिसका प्रयोग पहले के एआई से अलग है।

मल्टीमॉडल AI अन्य AI से किस प्रकार भिन्न है?

  •  मल्टीमॉडल एआई एआई मॉडल और मशीन लर्निंग एआई दृष्टिकोण का अनुसरण करता है।
  • एआई मॉडल एल्गोरिदम आधारित है। 
  • एआई एक सॉफ्टवेयर एप्लिकेशन है जो मशीन लर्निंग मॉडल पर आधारित है। उदाहरण के लिए ChatGPT AI एप्लिकेशन वर्तमान में GPT-4 मॉडल पर बनाया गया है।
  • मल्टीमॉडल एआई और पारंपरिक सिंगल मॉडल एआई के बीच मूलभूत अंतर डेटा का है।
  •  एक एकल मॉडल एआई को आम तौर पर एक ही स्रोत या डेटा के प्रकार के साथ काम करने के लिए डिज़ाइन किया गया है। उदाहरण के लिए एक वित्तीय एआई विश्लेषण करने, वित्तीय अनुमान लगाने और व्यवसाय के लिए संभावित वित्तीय समस्याओं का पता लगाने के लिए व्यापक आर्थिक एवं औद्योगिक क्षेत्र के डेटा के साथ-साथ व्यावसायिक वित्तीय डेटा का उपयोग करता है।
  • यह सिंगल मॉडल एआई को एक विशिष्ट कार्य के अनुरूप तैयार किया जाता है।
  • दूसरी ओर मल्टीमॉडल एआई वीडियो, चित्र, भाषण, ध्वनि आदि कई स्रोतों से डेटा प्राप्त करता है एवं उसको संसाधित करता है जिससे विशेष वातावरण या स्थिति की अधिक विस्तृत एवं सूक्ष्म धारणाएं संभव हो पाती हैं।
  • इससे मल्टीमॉडल एआई मानवीय धारणा का अधिक बारीकी से अनुकरण करता है।

मल्टीमॉडल AI की प्रौद्योगिकियाँ

  • प्राकृतिक भाषा प्रसंस्करण (Natural language processing) (NLP)  (एनएलपी) प्रौद्योगिकियां वाक् आउटपुट या पाठ-से-वाक् (text-to-speech)  क्षमताओं के साथ-साथ वाक् पहचान और वाक्-से-पाठ (speech-to-text) क्षमताएं प्रदान करती हैं।
  • कंप्यूटर विज़न प्रौद्योगिकियाँ (Computer vision technologies) छवि और वीडियो कैप्चर के लिए मानव के पहचान, वस्तु का पता लगाने एवं पहचान को स्पष्ट करती हैं,साथ ही,  दौड़ने या कूदने जैसी गतिविधियों को अलग करती हैं।
  • पाठ विश्लेषण सिस्टम (Text analysis system) लिखित भाषा को पढ़ने और समझने की अनुमति देता है।
  • एकीकरण प्रणालियाँ (Integration systems) मल्टीमॉडल एआई को उसके विभिन्न डेटा प्रकारों में डेटा इनपुट को संरेखित करने, संयोजित करने, प्राथमिकता देने और फ़िल्टर करने की अनुमति देती हैं। 
  • यह मल्टीमॉडल एआई की कुंजी है क्योंकि एकीकरण विकासशील संदर्भ और संदर्भ-आधारित निर्णय लेने पर केंद्रीत है।

मल्टीमॉडल एआई के उपयोग

  • कंप्यूटर विज़न में कई डेटा प्रकारों के संयोजन में जैसे  कुत्ते की छवि को कुत्ते की आवाज़ के साथ मिलाने से वस्तु की कुत्ते के रूप में सटीक पहचान की संभावना अधिक होती है।
  •  औद्योगिक कार्यक्षेत्र विनिर्माण प्रक्रियाओं की देखरेख और अनुकूलन, उत्पाद की गुणवत्ता में सुधार या रखरखाव लागत को कम करने के लिए मल्टीमॉडल एआई का उपयोग कर सकते हैं।
  •  हेल्थकेयर क्षेत्र में उपचार में सुधार, डायग्नोस्टिक डेटा और रिकॉर्ड को संसाधित करने के लिए मल्टीमॉडल एआई का उपयोग हो रहा है। 
  • ऑटोमोटिव क्षेत्र ड्राइवर के थकान के लक्षण जैसे- आंखें बंद होना, लेन से प्रस्थान पर नजर रखने के लिए मल्टीमॉडल एआई का उपयोग करता है।
  • मल्टीमॉडल एआई भावना विश्लेषण जैसे एनएलपी कार्य करता है। उदाहरण के लिए एक सिस्टम उपयोगकर्ता की आवाज़ में तनाव के संकेतों की पहचान करता है और उसे उपयोगकर्ता के चेहरे की अभिव्यक्ति में क्रोध के संकेतों के साथ जोड़कर उपयोगकर्ता की ज़रूरतों के अनुरूप प्रतिक्रियाएँ देता है।
  •  इसी तरह भाषण की ध्वनि के साथ पाठ के संयोजन से एआई को अन्य भाषाओं में उच्चारण और भाषण को बेहतर बनाने में मदद मिल सकती है।
  • मल्टीमॉडल एआई रोबोटिक्स विकास के लिए महत्त्वपूर्ण है। 
  • मल्टीमॉडल एआई पर्यावरण की विस्तृत समझ बनाने, बातचीत करने के लिए कैमरे, माइक्रोफोन, जीपीएस और अन्य सेंसर से डेटा का उपयोग करता है।

मल्टीमॉडल एआई चुनौतियाँ

  • मल्टीमॉडल एआई को संचालित करने के लिए आवश्यक डेटा सेट, डेटा वॉल्यूम को स्टोर करना और प्रोसेस करना महंगा है।
  • सीखने की बारीकियां जैसे एआई  समान शब्दों के अलग-अलग अर्थों को अलग करना एवं सिखाना जटिल हो सकता है।
  • एकाधिक डेटा प्रकारों से सार्थक डेटा को अलग करना मुश्किल है।
  • डेटा सेट में कई स्रोतों से डेटा एकत्र किया जाता है। नतीजतन डेटा पूर्णता, अखंडता और पूर्वाग्रह एआई मॉडल प्रशिक्षण के लिए एक समस्या हो सकती है।
  • डेटा स्रोत के  भ्रामक होने के परिणामस्वरूप AI में खराबी या गलत व्याख्या हो सकती है। 
  • निर्णय लेने की जटिलता क्योंकि प्रशिक्षण के माध्यम से विकसित नेटवर्क को समझना और व्याख्या करना मुश्किल हो सकता है।

प्रश्न:  निम्नलिखित कथनों पर विचार कीजिए 

  1. मल्टीमॉडल एआई एआई मॉडल और मशीन लर्निंग एआई दृष्टिकोण का अनुसरण करता है।
  2. मल्टीमॉडल एआई को संचालित करने के लिए आवश्यक डेटा सेट, डेटा वॉल्यूम को स्टोर करना और प्रोसेस करना सस्ता है।

उपर्युक्त में से कितने कथन सही हैं ?

 (a) केवल

(b) केवल 2  

(c) कथन 1 और 2 

(d) न तो 1 ना ही 2 

उत्तर: (a)

मुख्य परीक्षा प्रश्न : मल्टीमॉडल एआई क्या है ? मल्टीमॉडल एआई के प्रमुख विशेषताओं एवं चुनौतियों को रेखांकित कीजिए।

 स्रोत: the hindu

Have any Query?

Our support team will be happy to assist you!

OR