এআই গবেষণার গতিপথ: এলএলএম থেকে বিশ্ব মডেলে রূপান্তর
সম্পাদনা করেছেন: firstname lastname
২০২৫ সাল নাগাদ কৃত্রিম বুদ্ধিমত্তা (এআই) গবেষণার কেন্দ্রবিন্দু বৃহৎ ভাষা মডেল (এলএলএম) থেকে সরে এসে 'বিশ্ব মডেল' (World Models)-এর দিকে সুস্পষ্টভাবে স্থানান্তরিত হচ্ছে। এই পরিবর্তন মূলত এলএলএমগুলির একটি মৌলিক সীমাবদ্ধতা মোকাবিলার প্রচেষ্টা, যেখানে এই মডেলগুলির ভৌত জগৎ এবং কার্যকারণ সম্পর্ক বোঝার ক্ষেত্রে ঘাটতি রয়েছে। বিশ্ব মডেলগুলি কৃত্রিম বুদ্ধিমত্তাকে ভৌত জগৎকে অনুকরণ এবং তার ওপর যুক্তি প্রয়োগের ক্ষমতা প্রদানের লক্ষ্য রাখে, যা বাস্তব-জগতের মিথস্ক্রিয়ার জন্য অপরিহার্য।
জ্ঞানীয় বিজ্ঞানী গ্যারি মার্কাস দীর্ঘদিন ধরে যুক্তি দিয়ে আসছেন যে এলএলএমগুলির নির্ভরযোগ্যতা এবং যুক্তির ক্ষেত্রে মৌলিক সীমাবদ্ধতা রয়েছে, এবং তিনি এমন নিউরো-সিম্বলিক পদ্ধতির পক্ষে সওয়াল করেছেন যা বিশ্বের নিয়মগুলিকে স্পষ্টভাবে প্রোগ্রাম করে। মার্কাস মনে করেন যে কেবল স্কেলিং-এর মাধ্যমে ট্রান্সফরমার আর্কিটেকচার মানব-সদৃশ বুদ্ধিমত্তা অর্জন করতে পারবে না, কারণ গাণিতিক সমস্যা সমাধানের জন্য প্রতীকী হেরফেরের প্রয়োজন, যা বর্তমান নিউরাল নেটওয়ার্কগুলিতে অনুপস্থিত। এই দৃষ্টিভঙ্গি বিশ্ব মডেলগুলির প্রয়োজনীয়তাকে আরও জোরালো করে, যা বিমূর্ত নীতিগুলি সাধারণীকরণ করার ক্ষমতা রাখে।
স্ট্যানফোর্ডের বিশেষজ্ঞ ফেই-ফেই লি তাঁর 'ওয়ার্ল্ড ল্যাবস' (World Labs) থেকে 'মার্বেল' (Marble) নামে একটি বিশ্ব মডেল উন্মোচন করেছেন, যা স্থানিক বুদ্ধিমত্তার (spatial intelligence) উপর বিশেষ গুরুত্ব দেয়। লি যুক্তি দেন যে এজিআই অর্জনের জন্য উপলব্ধি (perception) থেকে কর্মে (action) উত্তরণ প্রয়োজন, এবং তাঁর মার্বেল মডেল টেক্সট প্রম্পট, ছবি বা ভিডিও ব্যবহার করে সম্পূর্ণ সম্পাদনাযোগ্য, স্থায়ী ত্রিমাত্রিক মহাবিশ্ব তৈরি করতে পারে। ওয়ার্ল্ড ল্যাবস ২০২৪ সালের সেপ্টেম্বরে যাত্রা শুরু করে এবং মার্বেল মডেলের উপর কাজ শুরু করে, যা স্থানিক বুদ্ধিমত্তাকে এআই বিকাশের পরবর্তী প্রধান স্তর হিসেবে চিহ্নিত করে।
অন্যদিকে, গুগল ডিপমাইন্ড তাদের সিমুলেশন কাজকে আরও এগিয়ে নিয়ে যাচ্ছে জেনি ৩ (Genie 3)-এর মতো মডেলের মাধ্যমে, যা টেক্সট প্রম্পট থেকে রিয়েল-টাইমে ইন্টারেক্টিভ ত্রিমাত্রিক জগৎ তৈরি করতে পারে। গুগল ডিপমাইন্ডের এই মডেলটি ২৪ ফ্রেম প্রতি সেকেন্ড (fps) এবং ৭২০পি রেজোলিউশনে সামঞ্জস্য বজায় রেখে কয়েক মিনিট ধরে গতিশীল জগৎ তৈরি করতে সক্ষম, যা এটিকে রোবট প্রশিক্ষণের জন্য একটি কার্যকর সিমুলেশন পরিবেশ করে তুলেছে। এই ধরনের সিমুলেশন পরিবেশ এআই এজেন্টদের বাস্তব জগতে কাজ করার আগে ভার্চুয়াল জগতে প্রশিক্ষণ দিতে সহায়ক, যা খরচ এবং ঝুঁকি হ্রাস করে।
এই পরিবর্তনের সবচেয়ে বড় উদাহরণগুলির মধ্যে একটি হল ইয়ান লেকান (Yann LeCun)-এর মেটা ত্যাগ করে শুধুমাত্র বিশ্ব মডেল তৈরির জন্য একটি স্টার্টআপ শুরু করা। লেকান, যিনি কনভোলিউশনাল নিউরাল নেটওয়ার্কের জনক হিসাবে পরিচিত এবং ২০১৮ সালে টুরিং পুরস্কার বিজয়ী, এলএলএম-কে এজিআই-এর জন্য একটি সম্ভাব্য অচলাবস্থা বলে মনে করেন। তিনি প্যারিস-ভিত্তিক 'অ্যাডভান্সড মেশিন ইন্টেলিজেন্স ল্যাবস' (AMI Labs) প্রতিষ্ঠা করছেন, যা রোবোটিক্স এবং পরিবহনের মতো ক্ষেত্রে প্রয়োগের জন্য ভৌত জগৎকে অনুকরণ ও যুক্তিযুক্ত করতে সক্ষম সিস্টেম তৈরির দিকে মনোনিবেশ করবে। লেকান মনে করেন যে পাঠ্য হলো বাস্তবতার একটি 'ক্ষয়িষ্ণু, সংকুচিত উপস্থাপনা', যা ভৌত জগৎ বোঝার জন্য যথেষ্ট নয়। ন্যাবলা (Nabla) স্টার্টআপের প্রতিষ্ঠাতা অ্যালেক্সান্ডার লেব্রুন এএমআই ল্যাবসের সিইও হিসাবে যোগদান করছেন।
এই সম্মিলিত প্রবণতা স্পষ্ট করে যে এআই সিস্টেমের মনোযোগ কেবল শব্দ ভবিষ্যদ্বাণী থেকে সরে এসে বাস্তব-জগতের মিথস্ক্রিয়া এবং ভৌত কারণ ও প্রভাব বোঝার দিকে নিবদ্ধ হচ্ছে। গবেষকরা এখন মাল্টিমোডাল লার্জ ল্যাঙ্গুয়েজ মডেল (MLLM) এবং ওয়ার্ল্ড মডেলের (WM) যৌথ আর্কিটেকচারের প্রয়োজনীয়তা দেখছেন, যা এমএলএলএম-এর শব্দার্থিক যুক্তি এবং ডব্লিউএম-এর পদার্থবিদ্যা-সচেতন ভবিষ্যদ্বাণীমূলক ক্ষমতাকে একত্রিত করে, যাতে গতিশীল পরিবেশে আরও শক্তিশালী এবং অভিযোজনযোগ্য এজেন্ট তৈরি করা যায়। এই পরিবর্তন এআই-কে নিছক ডেটা প্রক্রিয়াকরণ থেকে একটি সক্রিয়, জগৎ-সচেতন সত্তায় রূপান্তরিত করার পথে একটি গুরুত্বপূর্ণ পদক্ষেপ।
72 দৃশ্য
উৎসসমূহ
Marketplace
The Guardian
Nasdaq
Observer
Observer
এই বিষয়ে আরও খবর পড়ুন:
আপনি কি কোনো ত্রুটি বা অসঠিকতা খুঁজে পেয়েছেন?আমরা আপনার মন্তব্য যত তাড়াতাড়ি সম্ভব বিবেচনা করব।



