এআই গবেষণার গতিপথ: এলএলএম থেকে বিশ্ব মডেলে রূপান্তর

সম্পাদনা করেছেন: firstname lastname

২০২৫ সাল নাগাদ কৃত্রিম বুদ্ধিমত্তা (এআই) গবেষণার কেন্দ্রবিন্দু বৃহৎ ভাষা মডেল (এলএলএম) থেকে সরে এসে 'বিশ্ব মডেল' (World Models)-এর দিকে সুস্পষ্টভাবে স্থানান্তরিত হচ্ছে। এই পরিবর্তন মূলত এলএলএমগুলির একটি মৌলিক সীমাবদ্ধতা মোকাবিলার প্রচেষ্টা, যেখানে এই মডেলগুলির ভৌত জগৎ এবং কার্যকারণ সম্পর্ক বোঝার ক্ষেত্রে ঘাটতি রয়েছে। বিশ্ব মডেলগুলি কৃত্রিম বুদ্ধিমত্তাকে ভৌত জগৎকে অনুকরণ এবং তার ওপর যুক্তি প্রয়োগের ক্ষমতা প্রদানের লক্ষ্য রাখে, যা বাস্তব-জগতের মিথস্ক্রিয়ার জন্য অপরিহার্য।

জ্ঞানীয় বিজ্ঞানী গ্যারি মার্কাস দীর্ঘদিন ধরে যুক্তি দিয়ে আসছেন যে এলএলএমগুলির নির্ভরযোগ্যতা এবং যুক্তির ক্ষেত্রে মৌলিক সীমাবদ্ধতা রয়েছে, এবং তিনি এমন নিউরো-সিম্বলিক পদ্ধতির পক্ষে সওয়াল করেছেন যা বিশ্বের নিয়মগুলিকে স্পষ্টভাবে প্রোগ্রাম করে। মার্কাস মনে করেন যে কেবল স্কেলিং-এর মাধ্যমে ট্রান্সফরমার আর্কিটেকচার মানব-সদৃশ বুদ্ধিমত্তা অর্জন করতে পারবে না, কারণ গাণিতিক সমস্যা সমাধানের জন্য প্রতীকী হেরফেরের প্রয়োজন, যা বর্তমান নিউরাল নেটওয়ার্কগুলিতে অনুপস্থিত। এই দৃষ্টিভঙ্গি বিশ্ব মডেলগুলির প্রয়োজনীয়তাকে আরও জোরালো করে, যা বিমূর্ত নীতিগুলি সাধারণীকরণ করার ক্ষমতা রাখে।

স্ট্যানফোর্ডের বিশেষজ্ঞ ফেই-ফেই লি তাঁর 'ওয়ার্ল্ড ল্যাবস' (World Labs) থেকে 'মার্বেল' (Marble) নামে একটি বিশ্ব মডেল উন্মোচন করেছেন, যা স্থানিক বুদ্ধিমত্তার (spatial intelligence) উপর বিশেষ গুরুত্ব দেয়। লি যুক্তি দেন যে এজিআই অর্জনের জন্য উপলব্ধি (perception) থেকে কর্মে (action) উত্তরণ প্রয়োজন, এবং তাঁর মার্বেল মডেল টেক্সট প্রম্পট, ছবি বা ভিডিও ব্যবহার করে সম্পূর্ণ সম্পাদনাযোগ্য, স্থায়ী ত্রিমাত্রিক মহাবিশ্ব তৈরি করতে পারে। ওয়ার্ল্ড ল্যাবস ২০২৪ সালের সেপ্টেম্বরে যাত্রা শুরু করে এবং মার্বেল মডেলের উপর কাজ শুরু করে, যা স্থানিক বুদ্ধিমত্তাকে এআই বিকাশের পরবর্তী প্রধান স্তর হিসেবে চিহ্নিত করে।

অন্যদিকে, গুগল ডিপমাইন্ড তাদের সিমুলেশন কাজকে আরও এগিয়ে নিয়ে যাচ্ছে জেনি ৩ (Genie 3)-এর মতো মডেলের মাধ্যমে, যা টেক্সট প্রম্পট থেকে রিয়েল-টাইমে ইন্টারেক্টিভ ত্রিমাত্রিক জগৎ তৈরি করতে পারে। গুগল ডিপমাইন্ডের এই মডেলটি ২৪ ফ্রেম প্রতি সেকেন্ড (fps) এবং ৭২০পি রেজোলিউশনে সামঞ্জস্য বজায় রেখে কয়েক মিনিট ধরে গতিশীল জগৎ তৈরি করতে সক্ষম, যা এটিকে রোবট প্রশিক্ষণের জন্য একটি কার্যকর সিমুলেশন পরিবেশ করে তুলেছে। এই ধরনের সিমুলেশন পরিবেশ এআই এজেন্টদের বাস্তব জগতে কাজ করার আগে ভার্চুয়াল জগতে প্রশিক্ষণ দিতে সহায়ক, যা খরচ এবং ঝুঁকি হ্রাস করে।

এই পরিবর্তনের সবচেয়ে বড় উদাহরণগুলির মধ্যে একটি হল ইয়ান লেকান (Yann LeCun)-এর মেটা ত্যাগ করে শুধুমাত্র বিশ্ব মডেল তৈরির জন্য একটি স্টার্টআপ শুরু করা। লেকান, যিনি কনভোলিউশনাল নিউরাল নেটওয়ার্কের জনক হিসাবে পরিচিত এবং ২০১৮ সালে টুরিং পুরস্কার বিজয়ী, এলএলএম-কে এজিআই-এর জন্য একটি সম্ভাব্য অচলাবস্থা বলে মনে করেন। তিনি প্যারিস-ভিত্তিক 'অ্যাডভান্সড মেশিন ইন্টেলিজেন্স ল্যাবস' (AMI Labs) প্রতিষ্ঠা করছেন, যা রোবোটিক্স এবং পরিবহনের মতো ক্ষেত্রে প্রয়োগের জন্য ভৌত জগৎকে অনুকরণ ও যুক্তিযুক্ত করতে সক্ষম সিস্টেম তৈরির দিকে মনোনিবেশ করবে। লেকান মনে করেন যে পাঠ্য হলো বাস্তবতার একটি 'ক্ষয়িষ্ণু, সংকুচিত উপস্থাপনা', যা ভৌত জগৎ বোঝার জন্য যথেষ্ট নয়। ন্যাবলা (Nabla) স্টার্টআপের প্রতিষ্ঠাতা অ্যালেক্সান্ডার লেব্রুন এএমআই ল্যাবসের সিইও হিসাবে যোগদান করছেন।

এই সম্মিলিত প্রবণতা স্পষ্ট করে যে এআই সিস্টেমের মনোযোগ কেবল শব্দ ভবিষ্যদ্বাণী থেকে সরে এসে বাস্তব-জগতের মিথস্ক্রিয়া এবং ভৌত কারণ ও প্রভাব বোঝার দিকে নিবদ্ধ হচ্ছে। গবেষকরা এখন মাল্টিমোডাল লার্জ ল্যাঙ্গুয়েজ মডেল (MLLM) এবং ওয়ার্ল্ড মডেলের (WM) যৌথ আর্কিটেকচারের প্রয়োজনীয়তা দেখছেন, যা এমএলএলএম-এর শব্দার্থিক যুক্তি এবং ডব্লিউএম-এর পদার্থবিদ্যা-সচেতন ভবিষ্যদ্বাণীমূলক ক্ষমতাকে একত্রিত করে, যাতে গতিশীল পরিবেশে আরও শক্তিশালী এবং অভিযোজনযোগ্য এজেন্ট তৈরি করা যায়। এই পরিবর্তন এআই-কে নিছক ডেটা প্রক্রিয়াকরণ থেকে একটি সক্রিয়, জগৎ-সচেতন সত্তায় রূপান্তরিত করার পথে একটি গুরুত্বপূর্ণ পদক্ষেপ।

72 দৃশ্য

উৎসসমূহ

  • Marketplace

  • The Guardian

  • Nasdaq

  • Observer

  • Observer

আপনি কি কোনো ত্রুটি বা অসঠিকতা খুঁজে পেয়েছেন?আমরা আপনার মন্তব্য যত তাড়াতাড়ি সম্ভব বিবেচনা করব।