एआई अनुसंधान में बदलाव: एलएलएम से विश्व मॉडलों की ओर गति
द्वारा संपादित: firstname lastname
वर्ष 2025 में कृत्रिम सामान्य बुद्धिमत्ता (एजीआई) अनुसंधान की दिशा में एक स्पष्ट बदलाव देखा जा रहा है, जिसमें बड़े भाषा मॉडल (एलएलएम) से ध्यान हटाकर 'विश्व मॉडलों' (World Models) पर केंद्रित किया जा रहा है। यह परिवर्तन इस मौलिक आवश्यकता से प्रेरित है कि एआई प्रणालियों को केवल पाठ की भविष्यवाणी करने के बजाय भौतिक जगत के साथ सार्थक रूप से अंतःक्रिया करने में सक्षम होना चाहिए। विश्व मॉडल का उद्देश्य एआई को भौतिकी और कारणता की समझ प्रदान करना है, जो कि एलएलएम की एक प्रमुख सीमा रही है, क्योंकि वे अक्सर वास्तविक दुनिया के नियमों को समझने में विफल रहते हैं।
इस वैचारिक बदलाव के प्रमुख समर्थक वैज्ञानिकों में संज्ञानात्मक वैज्ञानिक गैरी मार्कस शामिल हैं, जो दृढ़ता से मानते हैं कि एलएलएम की विश्वसनीयता और तर्क क्षमताएं अंतर्निहित रूप से सीमित हैं। मार्कस न्यूरो-सिम्बोलिक दृष्टिकोणों का समर्थन करते हैं, जहाँ विश्व के नियमों को स्पष्ट रूप से प्रोग्राम किया जाता है, जो डीप लर्निंग को प्रतीकात्मक संचालन के साथ जोड़ता है ताकि सामान्यीकरण में सुधार हो सके। यह दृष्टिकोण, जो दशकों से चर्चा में है, अब एआई के अगले चरण के लिए महत्वपूर्ण माना जा रहा है, क्योंकि यह केवल डेटा स्केलिंग से परे जाकर अमूर्त सिद्धांतों की समझ पर जोर देता है।
इस नई दिशा में महत्वपूर्ण प्रगति स्टैनफोर्ड की विशेषज्ञ फेई-फेई ली के नेतृत्व में हो रही है, जिन्होंने 'स्पेसियल इंटेलिजेंस' (स्थानिक बुद्धिमत्ता) को एजीआई के लिए अगला मोर्चा बताया है। उनकी कंपनी वर्ल्ड लैब्स ने 'मार्बल' नामक एक विश्व मॉडल जारी किया है, जो पाठ संकेतों, छवियों या वीडियो से पूर्ण 3डी वातावरण का निर्माण और अनुकरण कर सकता है। ली का तर्क है कि मनुष्यों के लिए, स्थानिक बुद्धिमत्ता ही वह आधार है जिस पर संज्ञान का निर्माण होता है, और एआई को वास्तविकता समझने के लिए इस क्षमता की आवश्यकता है। मार्बल, जो कि 230 मिलियन डॉलर की पूंजी से समर्थित है, रचनात्मक पाइपलाइनों के साथ एकीकरण की अनुमति देने के लिए गॉसियन स्प्लैट्स और मेश प्रारूपों में निर्यात का समर्थन करता है।
तकनीकी मोर्चे पर, गूगल डीपमाइंड ने अपने सिमुलेशन कार्य को 'जेनी 3' जैसे मॉडलों के साथ आगे बढ़ाया है, जो पाठ संकेतों से 24 फ्रेम प्रति सेकंड (एफपीएस) पर इंटरैक्टिव 3डी दुनिया उत्पन्न कर सकता है, जो एआई एजेंटों के प्रशिक्षण के लिए एक महत्वपूर्ण मील का पत्थर है। जेनी 3 एजेंटों को आभासी दुनिया में अनुभव के माध्यम से विकसित होने की अनुमति देता है, जो भौतिकी की निरंतरता बनाए रखते हुए कई मिनटों तक चल सकता है। यह विकास एम्बेडेड एआई के लिए एक प्रशिक्षण मैदान प्रदान करता है, जहाँ एजेंट वास्तविक दुनिया के जोखिमों के बिना परीक्षण और त्रुटि के माध्यम से सीख सकते हैं।
इस क्षेत्र में एक और प्रमुख घटनाक्रम यान लेकुन का मेटा से अलग होना है, जो अब विशेष रूप से विश्व मॉडल बनाने के लिए एक स्टार्टअप शुरू करने पर ध्यान केंद्रित कर रहे हैं। लेकुन, जो स्वयं डीप लर्निंग के अग्रदूतों में से एक हैं, एलएलएम को संभावित रूप से एक 'डेड एंड' मानते हैं, खासकर जब बात मूर्त बुद्धिमत्ता (Embodied Intelligence) की आती है। उन्होंने तर्क दिया है कि विश्व मॉडल, जो वीडियो और स्थानिक डेटा से सीखते हैं, रोबोटिक्स और स्वायत्त प्रणालियों के लिए अधिक उपयुक्त हैं क्योंकि वे भौतिक वातावरण के बारे में तर्क कर सकते हैं। लेकुन की नई कंपनी, एएमआई (एडवांस्ड मशीन इंटेलिजेंस), जेईपीए (ज्वाइंट एम्बेडिंग प्रेडिक्टिव आर्किटेक्चर) पर ध्यान केंद्रित कर रही है, जिसका उद्देश्य स्केलिंग लागत से बचते हुए वास्तविक दुनिया के तर्क को सक्षम करना है।
यह सर्वसम्मत बदलाव मूर्त बुद्धिमत्ता की ओर इशारा करता है, जो केवल शब्द भविष्यवाणी से परे जाकर वास्तविक दुनिया की जटिलताओं में सक्रिय रूप से भाग लेने में सक्षम एआई प्रणालियों की बढ़ती आवश्यकता को दर्शाता है। शोधकर्ता अब एक संयुक्त एमएलएलएम-डब्ल्यूएम वास्तुकला की आवश्यकता पर भी विचार कर रहे हैं, जहाँ एलएलएम उच्च-स्तरीय शब्दार्थ तर्क प्रदान करते हैं और विश्व मॉडल भौतिकी-जागरूक सिमुलेशन के साथ उन योजनाओं को सत्यापित करते हैं, जिससे सिमेंटिक बुद्धिमत्ता और जमीनी भौतिक संपर्क के बीच की खाई पटती है।
72 दृश्य
स्रोतों
Marketplace
The Guardian
Nasdaq
Observer
Observer
इस विषय पर और अधिक समाचार पढ़ें:
क्या आपने कोई गलती या अशुद्धि पाई?हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।



