গবেষকরা BigSolDB 2.0 নামে একটি নতুন এবং বিস্তৃত ডেটাসেট প্রকাশ করেছেন, যা জৈব যৌগের দ্রবণীয়তার উপর পরীক্ষামূলক তথ্য সংগ্রহ করে তৈরি করা হয়েছে। রসায়ন, পদার্থ বিজ্ঞান এবং ফার্মাসিউটিক্যালসের মতো বিভিন্ন ক্ষেত্রে জৈব যৌগের দ্রবণীয়তা একটি অত্যন্ত গুরুত্বপূর্ণ বৈশিষ্ট্য, যা যৌগের কার্যকারিতা এবং প্রয়োগ নির্ধারণে মুখ্য ভূমিকা পালন করে। তবে, জল ব্যতীত অন্যান্য দ্রাবকে জৈব যৌগের দ্রবণীয়তার পূর্বাভাস দেওয়া একটি বড় চ্যালেঞ্জ ছিল, যা এই নতুন ডেটাসেট দ্বারা মোকাবেলা করার চেষ্টা করা হয়েছে।
BigSolDB 2.0 ডেটাসেটে মোট ১,০৩,৯৪৪টি পরীক্ষামূলক দ্রবণীয়তার মান অন্তর্ভুক্ত রয়েছে। এই মানগুলি ১,৪৮৮টি ভিন্ন জৈব যৌগ এবং ২১৩টি বিভিন্ন দ্রাবকের উপর ভিত্তি করে সংগৃহীত হয়েছে। তথ্যগুলি ২৪৩ থেকে ৪২৫ কেলভিন তাপমাত্রার পরিসরে পরিমাপ করা হয়েছে এবং ১,৫৯৫টি পিয়ার-রিভিউড নিবন্ধ থেকে সংগ্রহ করা হয়েছে। ডেটাসেটটি মেশিন-রিডেবল ফরম্যাটে তৈরি করা হয়েছে, যা ডেটা-চালিত বিশ্লেষণকে সহজ করে তোলে। এছাড়াও, গবেষকরা একটি ওয়েব-ভিত্তিক টুল তৈরি করেছেন যা ডেটাসেটটিকে সহজে অনুসন্ধান এবং ভিজ্যুয়ালাইজ করতে সাহায্য করে।
এই ডেটাসেটের প্রকাশনা কেমিনফরমেটিক্স ক্ষেত্রে একটি উল্লেখযোগ্য অগ্রগতি। পূর্বে, জল ব্যতীত অন্যান্য দ্রাবকে দ্রবণীয়তার তথ্য সমৃদ্ধ এবং বৈচিত্র্যপূর্ণ ডেটাসেটের অভাব ছিল। BigSolDB 2.0 এই শূন্যস্থান পূরণ করেছে এবং এটি মেশিন লার্নিং মডেলগুলির বিকাশের জন্য একটি শক্তিশালী ভিত্তি হিসেবে কাজ করবে। এই মডেলগুলি নতুন ওষুধ আবিষ্কার, পদার্থের নকশা এবং অন্যান্য রাসায়নিক প্রক্রিয়াগুলির উন্নয়নে সহায়ক হবে।
গবেষকরা মনে করেন যে BigSolDB 2.0 ডেটাসেটটি দ্রবণীয়তা পূর্বাভাসের জন্য মেশিন লার্নিং মডেলগুলির বিকাশে একটি মানদণ্ড হিসেবে কাজ করবে। এই ডেটাসেটের মাধ্যমে তৈরি মডেলগুলি আরও নির্ভুলভাবে যৌগের দ্রবণীয়তা পূর্বাভাস দিতে সক্ষম হবে, যা গবেষণা ও উন্নয়নের প্রক্রিয়াকে ত্বরান্বিত করবে। এটি বিজ্ঞানীদের নতুন যৌগ সংশ্লেষণ এবং তাদের বৈশিষ্ট্যগুলি বোঝার ক্ষেত্রে একটি নতুন পথ খুলে দেবে, যা রসায়ন এবং সংশ্লিষ্ট ক্ষেত্রগুলিতে উদ্ভাবনের নতুন দ্বার উন্মোচন করবে।