এআই গবেষণার গতিপথ: এলএলএম থেকে বিশ্ব মডেলে রূপান্তর

12:25, 19 ডিসেম্বর

সম্পাদনা করেছেন: firstname lastname

iframe { display: none; }

এআই গবেষণার গতিপথ: এলএলএম থেকে বিশ্ব মডেলে রূপান্তর

২০২৫ সাল নাগাদ কৃত্রিম বুদ্ধিমত্তা (এআই) গবেষণার কেন্দ্রবিন্দু বৃহৎ ভাষা মডেল (এলএলএম) থেকে সরে এসে 'বিশ্ব মডেল' (World Models)-এর দিকে সুস্পষ্টভাবে স্থানান্তরিত হচ্ছে। এই পরিবর্তন মূলত এলএলএমগুলির একটি মৌলিক সীমাবদ্ধতা মোকাবিলার প্রচেষ্টা, যেখানে এই মডেলগুলির ভৌত জগৎ এবং কার্যকারণ সম্পর্ক বোঝার ক্ষেত্রে ঘাটতি রয়েছে। বিশ্ব মডেলগুলি কৃত্রিম বুদ্ধিমত্তাকে ভৌত জগৎকে অনুকরণ এবং তার ওপর যুক্তি প্রয়োগের ক্ষমতা প্রদানের লক্ষ্য রাখে, যা বাস্তব-জগতের মিথস্ক্রিয়ার জন্য অপরিহার্য।

জ্ঞানীয় বিজ্ঞানী গ্যারি মার্কাস দীর্ঘদিন ধরে যুক্তি দিয়ে আসছেন যে এলএলএমগুলির নির্ভরযোগ্যতা এবং যুক্তির ক্ষেত্রে মৌলিক সীমাবদ্ধতা রয়েছে, এবং তিনি এমন নিউরো-সিম্বলিক পদ্ধতির পক্ষে সওয়াল করেছেন যা বিশ্বের নিয়মগুলিকে স্পষ্টভাবে প্রোগ্রাম করে। মার্কাস মনে করেন যে কেবল স্কেলিং-এর মাধ্যমে ট্রান্সফরমার আর্কিটেকচার মানব-সদৃশ বুদ্ধিমত্তা অর্জন করতে পারবে না, কারণ গাণিতিক সমস্যা সমাধানের জন্য প্রতীকী হেরফেরের প্রয়োজন, যা বর্তমান নিউরাল নেটওয়ার্কগুলিতে অনুপস্থিত। এই দৃষ্টিভঙ্গি বিশ্ব মডেলগুলির প্রয়োজনীয়তাকে আরও জোরালো করে, যা বিমূর্ত নীতিগুলি সাধারণীকরণ করার ক্ষমতা রাখে।

স্ট্যানফোর্ডের বিশেষজ্ঞ ফেই-ফেই লি তাঁর 'ওয়ার্ল্ড ল্যাবস' (World Labs) থেকে 'মার্বেল' (Marble) নামে একটি বিশ্ব মডেল উন্মোচন করেছেন, যা স্থানিক বুদ্ধিমত্তার (spatial intelligence) উপর বিশেষ গুরুত্ব দেয়। লি যুক্তি দেন যে এজিআই অর্জনের জন্য উপলব্ধি (perception) থেকে কর্মে (action) উত্তরণ প্রয়োজন, এবং তাঁর মার্বেল মডেল টেক্সট প্রম্পট, ছবি বা ভিডিও ব্যবহার করে সম্পূর্ণ সম্পাদনাযোগ্য, স্থায়ী ত্রিমাত্রিক মহাবিশ্ব তৈরি করতে পারে। ওয়ার্ল্ড ল্যাবস ২০২৪ সালের সেপ্টেম্বরে যাত্রা শুরু করে এবং মার্বেল মডেলের উপর কাজ শুরু করে, যা স্থানিক বুদ্ধিমত্তাকে এআই বিকাশের পরবর্তী প্রধান স্তর হিসেবে চিহ্নিত করে।

অন্যদিকে, গুগল ডিপমাইন্ড তাদের সিমুলেশন কাজকে আরও এগিয়ে নিয়ে যাচ্ছে জেনি ৩ (Genie 3)-এর মতো মডেলের মাধ্যমে, যা টেক্সট প্রম্পট থেকে রিয়েল-টাইমে ইন্টারেক্টিভ ত্রিমাত্রিক জগৎ তৈরি করতে পারে। গুগল ডিপমাইন্ডের এই মডেলটি ২৪ ফ্রেম প্রতি সেকেন্ড (fps) এবং ৭২০পি রেজোলিউশনে সামঞ্জস্য বজায় রেখে কয়েক মিনিট ধরে গতিশীল জগৎ তৈরি করতে সক্ষম, যা এটিকে রোবট প্রশিক্ষণের জন্য একটি কার্যকর সিমুলেশন পরিবেশ করে তুলেছে। এই ধরনের সিমুলেশন পরিবেশ এআই এজেন্টদের বাস্তব জগতে কাজ করার আগে ভার্চুয়াল জগতে প্রশিক্ষণ দিতে সহায়ক, যা খরচ এবং ঝুঁকি হ্রাস করে।

এই পরিবর্তনের সবচেয়ে বড় উদাহরণগুলির মধ্যে একটি হল ইয়ান লেকান (Yann LeCun)-এর মেটা ত্যাগ করে শুধুমাত্র বিশ্ব মডেল তৈরির জন্য একটি স্টার্টআপ শুরু করা। লেকান, যিনি কনভোলিউশনাল নিউরাল নেটওয়ার্কের জনক হিসাবে পরিচিত এবং ২০১৮ সালে টুরিং পুরস্কার বিজয়ী, এলএলএম-কে এজিআই-এর জন্য একটি সম্ভাব্য অচলাবস্থা বলে মনে করেন। তিনি প্যারিস-ভিত্তিক 'অ্যাডভান্সড মেশিন ইন্টেলিজেন্স ল্যাবস' (AMI Labs) প্রতিষ্ঠা করছেন, যা রোবোটিক্স এবং পরিবহনের মতো ক্ষেত্রে প্রয়োগের জন্য ভৌত জগৎকে অনুকরণ ও যুক্তিযুক্ত করতে সক্ষম সিস্টেম তৈরির দিকে মনোনিবেশ করবে। লেকান মনে করেন যে পাঠ্য হলো বাস্তবতার একটি 'ক্ষয়িষ্ণু, সংকুচিত উপস্থাপনা', যা ভৌত জগৎ বোঝার জন্য যথেষ্ট নয়। ন্যাবলা (Nabla) স্টার্টআপের প্রতিষ্ঠাতা অ্যালেক্সান্ডার লেব্রুন এএমআই ল্যাবসের সিইও হিসাবে যোগদান করছেন।

এই সম্মিলিত প্রবণতা স্পষ্ট করে যে এআই সিস্টেমের মনোযোগ কেবল শব্দ ভবিষ্যদ্বাণী থেকে সরে এসে বাস্তব-জগতের মিথস্ক্রিয়া এবং ভৌত কারণ ও প্রভাব বোঝার দিকে নিবদ্ধ হচ্ছে। গবেষকরা এখন মাল্টিমোডাল লার্জ ল্যাঙ্গুয়েজ মডেল (MLLM) এবং ওয়ার্ল্ড মডেলের (WM) যৌথ আর্কিটেকচারের প্রয়োজনীয়তা দেখছেন, যা এমএলএলএম-এর শব্দার্থিক যুক্তি এবং ডব্লিউএম-এর পদার্থবিদ্যা-সচেতন ভবিষ্যদ্বাণীমূলক ক্ষমতাকে একত্রিত করে, যাতে গতিশীল পরিবেশে আরও শক্তিশালী এবং অভিযোজনযোগ্য এজেন্ট তৈরি করা যায়। এই পরিবর্তন এআই-কে নিছক ডেটা প্রক্রিয়াকরণ থেকে একটি সক্রিয়, জগৎ-সচেতন সত্তায় রূপান্তরিত করার পথে একটি গুরুত্বপূর্ণ পদক্ষেপ।

72 দৃশ্য

উৎসসমূহ

Marketplace
The Guardian
Nasdaq
Observer
Observer

এই বিষয়ে আরও খবর পড়ুন:

30 জানুয়ারি

দৈনিক কার্যকলাপের ক্ষুদ্র বিরতি: স্বাস্থ্য ও মেজাজ বৃদ্ধিতে 'মুভমেন্ট স্ন্যাকস'-এর ভূমিকা

15 জানুয়ারি

অপ্রকাশিত গৌণ লাভ: সম্পর্কগত অচলাবস্থার মনস্তাত্ত্বিক বিশ্লেষণ

15 জানুয়ারি

জীবনযাত্রার সততা ও কঠোর ডেটিং মানদণ্ড নিয়ে কন্টেন্ট ক্রিয়েটর ব্রুক রবিন্সের সাহসী বক্তব্য

আপনি কি কোনো ত্রুটি বা অসঠিকতা খুঁজে পেয়েছেন?আমরা আপনার মন্তব্য যত তাড়াতাড়ি সম্ভব বিবেচনা করব।