বর্তমান কৃত্রিম বুদ্ধিমত্তা প্রযুক্তির প্রতিযোগিতায় কোন মডেল কতটা এগিয়ে-তা বোঝা সহজ নয়। কারণ সময়ের সঙ্গে সঙ্গে ওপেনএআই ও গুগলের মতো বড় প্রতিষ্ঠানের তৈরি মডেলগুলোর পারফরম্যান্স দ্রুত বদলে যাচ্ছে। ফলে নির্দিষ্ট প্রম্পট দিয়ে সরাসরি তুলনা করাকে গবেষকরা যথাযথ পদ্ধতি হিসেবে দেখছেন না।
প্রতিবেদনে বলা হয়েছে, কৃত্রিম বুদ্ধিমত্তার সক্ষমতা যাচাইয়ের জন্য এখন বিভিন্ন মানদণ্ড বা বেঞ্চমার্ক ব্যবহার করা হয়, যেখানে সামগ্রিক বিচার-বিশ্লেষণ ও সমস্যা সমাধানের দক্ষতা পরিমাপ করা হয়। এমন তিনটি গুরুত্বপূর্ণ পরীক্ষায় চ্যাটজিপিটি তুলনামূলকভাবে জেমিনির চেয়ে ভালো ফল করেছে।
প্রথমটি হলো অত্যন্ত কঠিন ও ‘গুগল-প্রুফ’ প্রশ্নভিত্তিক পরীক্ষা, যেখানে পদার্থবিজ্ঞান, রসায়ন ও জীববিজ্ঞানের উচ্চতর পর্যায়ের জ্ঞান যাচাই করা হয়। এই পরীক্ষায় চ্যাটজিপিটি সামান্য ব্যবধানে এগিয়ে থাকে-এর স্কোর ৯২ দশমিক চার শতাংশ, যেখানে জেমিনির স্কোর ৯১ দশমিক নয় শতাংশ।
দ্বিতীয় পরীক্ষাটি বাস্তব জগতের সফটওয়্যার ত্রুটি বা কোডিং সমস্যা সমাধান নিয়ে, যেখানে এআইকে অপরিচিত কোড বিশ্লেষণ করে কার্যকর সমাধান দিতে হয়। এখানে চ্যাটজিপিটি প্রায় ২৪ শতাংশ সমস্যা সমাধান করতে সক্ষম হয়, আর জেমিনাই পারে ১৮ শতাংশ।
তৃতীয়টি হলো জটিল ধাঁধা বা যুক্তিভিত্তিক সমস্যা সমাধানের পরীক্ষা, যেখানে নতুন পরিস্থিতিতে এআইয়ের সাধারণ বুদ্ধিমত্তা যাচাই করা হয়। এই পরীক্ষায় চ্যাটজিপিটি-র স্কোর ৫৪ দশমিক দুই শতাংশ, যা জেমিনাইয়ের বিভিন্ন সংস্করণের তুলনায় কিছুটা বেশি।
বিশেষজ্ঞদের মতে, এসব পরীক্ষায় চ্যাটজিপিটির এগিয়ে থাকা ইঙ্গিত দেয় যে জটিল যুক্তি, বাস্তব কোডিং সমস্যা এবং নতুন পরিস্থিতিতে সিদ্ধান্ত নেওয়ার ক্ষেত্রে এটি বর্তমানে তুলনামূলকভাবে শক্তিশালী অবস্থানে রয়েছে। তবে একই সঙ্গে তারা বলছেন, এই ব্যবধান দ্রুত পরিবর্তনশীল এবং ভবিষ্যতে পরিস্থিতি ভিন্ন হতে পারে।
সানা/আপ্র/৪/৭/২০২৬