ঢাকা ০৩:৫০ পূর্বাহ্ন, মঙ্গলবার, ১১ ফেব্রুয়ারী ২০২৫

জেমিনাই ২.০ এআই মডেল সবার জন্য উন্মুক্ত

  • আপডেট সময় : ০৪:২০:৪৭ অপরাহ্ন, রবিবার, ৯ ফেব্রুয়ারী ২০২৫
  • ১৮ বার পড়া হয়েছে

বিজ্ঞান ও প্রযুক্তি ডেস্ক: নিজেদের ভার্চুয়াল এআই সহকারী জেমিনাইয়ের পরবর্তী প্রজন্ম জেমিনাই ২.০ সবার জন্য খুলে দিয়েছে সার্চ জায়ান্ট গুগল। কোম্পানিটি বলছে, এখন পর্যন্ত তাদের ‘সবচেয়ে কার্যকর’ এআই মডেল স্যুট এটি।

গত ডিসেম্বরে জেমিনাই ২.০ এআই মডেল প্রকাশ করে গুগল। ওই সময় ডেভেলপার ও কিছু বিশ্বস্ত পরীক্ষকের পাশাপাশি নিজেদের কিছু পণ্যে এ এআই মডেলটি জুড়ে দিয়েছিল তারা; যা এআই মডেলটির একটি ‘জেনালের রিলিজ’ ছিল।

নতুন সংস্করণকে ‘জেমিনাই ২.০ ফ্ল্যাশ’ বলছে গুগল। ওই এআই মডেলের টেক্সট, অডিও, ভিডিও ও ইমেজ ইনপুট একসঙ্গে বুঝতে পারার ক্ষমতাকে বলা হচ্ছে মাল্টিমোডালিটি।
সার্চ জায়ান্টটি বলছে, জেমিনাই ২.০ ফ্ল্যাশ মডেল টেক্সট, অডিও, ভিডিও ও ইমেজ ইনপুট বোঝার পাশাপাশি মাল্টিমোডাল আউটপুটও তৈরি করতে পারে, যেমন ছবির সঙ্গে লেখা তৈরি। এতে আরও রয়েছে কোডিং পারফরম্যান্সের জন্য পরীক্ষামূলকভাবে ২.০ প্রো ও ২.০ ফ্ল্যাশ-লাইট, যেটিকে ‘এখনও পর্যন্ত নিজেদের সবচেয়ে সাশ্রয়ী মডেল’ বলে বর্ণনা করেছে তারা।

ওই এআই মডেলট ব্যবহারের জন্য প্রতি ১০ লাখ টোকেনের টেক্সট, ছবি ও ভিডিও ইনপুটের জন্য ১০ সেন্ট খরচ হবে ডেভেলপারদের। অন্যদিকে এআই মডেলটির আরও সাশ্রয়ী সংস্করণ ‘ফ্ল্যাশ-লাইট’সহ ব্যবহারের ক্ষেত্রে তাদের ০.৭৫ সেন্ট খরচ হবে বলে প্রতিবেদনে লিখেছে আমেরিকান সংবাদমাধ্যম সিএনবিবি। এখানে টোকেন বলতে মডেলটি প্রক্রিয়াজাত করে এমন প্রতিটি আলাদা ডেটা ইউনিটকে বোঝায়।

মেটা, অ্যামাজন, মাইক্রোসফট, ওপেনএআই ও অ্যানথ্রোপিকও এআই এজেন্ট বা বিভিন্ন এআইভিত্তিক মডেল তৈরির দিকে এগিয়ে যাচ্ছে; যা ব্যবহারকারীর জন্য জটিল বিভিন্ন কাজ সম্পন্ন করবে। ফলে ব্যবহারকারীদের আলাদা কোনো পদক্ষেপের মধ্য দিয়ে যেতে হবে না। নির্দিষ্ট কাজে বা বিষয়ে বিশেষজ্ঞ হওয়ার জন্য বিশেষভাবে তৈরি করা কৃত্রিম বুদ্ধিমত্তা মডেলকে বলা হচ্ছে এআই এজেন্ট।
গত ডিসেম্বরের এক ব্লগ পোস্টে গুগল লিখেছে, “গত বছর ধরে আমরা আরও এআই এজেন্ট বিকাশে বিনিয়োগ করছি। যার মানে, আপনার আশপাশের জগৎ সম্পর্কে আরও ভালোভাবে বুঝতে পারবে এরা, একাধিক ধাপ এগিয়ে চিন্তা করতে পারবে ও আপনার তত্ত্বাবধানে আপনার হয়ে পদক্ষেপ নেবে এসব মডেল।

জেমিনাই ২.০ মাল্টিমোডালিটিতে নতুন অগ্রগতির পাশাপাশি নেটিভ টুলে ব্যবহারের মাধ্যমে, এটি আমাদের নতুন এআই এজেন্ট তৈরি করতে দেবে; যা আমাদের ‘ইউনিভার্সাল অ্যাসিস্ট্যান্ট তৈরির’ কাছাকাছি নিয়ে যাবে।
সম্প্রতি ‘অপারেটর’ নামে গুগলের মতো একইরকম ফিচার চালু করেছে ওপেনএআই, যা ছুটির পরিকল্পনা, ফর্ম পূরণ, রেস্তোঁরা রিজার্ভেশন ও দোকানে অর্ডার করার মতো বিভিন্ন কাজ স্বয়ংক্রিয়ভাবে করতে পারে।
মাইক্রোসফট সমর্থিত এই স্টার্টআপটি ‘অপারেটর’কে ‘এমন এক এজেন্ট হিসাবে বর্ণনা করেছে; যা ব্যবহারকারীর জন্য কাজ সম্পন্ন করতে ওয়েব ব্রাউজারে পর্যন্ত যেতে পারে’। এছাড়া এ সপ্তাহের শুরুতে ‘ডিপ রিসার্চ’ নামের এআই টুল চালু করেছে ওপেনএআই; যা এআই এজেন্টকে জটিল গবেষণা প্রতিবেদন সংকলন ও ব্যবহারকারীর পছন্দের প্রশ্ন ও নানা বিষয় বিশ্লেষণ করতে সহায়তা করবে।

 

ট্যাগস :

যোগাযোগ

সম্পাদক : ডা. মোঃ আহসানুল কবির, প্রকাশক : শেখ তানভীর আহমেদ কর্তৃক ন্যাশনাল প্রিন্টিং প্রেস, ১৬৭ ইনার সার্কুলার রোড, মতিঝিল থেকে মুদ্রিত ও ৫৬ এ এইচ টাওয়ার (৯ম তলা), রোড নং-২, সেক্টর নং-৩, উত্তরা মডেল টাউন, ঢাকা-১২৩০ থেকে প্রকাশিত। ফোন-৪৮৯৫৬৯৩০, ৪৮৯৫৬৯৩১, ফ্যাক্স : ৮৮-০২-৭৯১৪৩০৮, ই-মেইল : [email protected]
আপলোডকারীর তথ্য

মব বন্ধ না করলে ডেভিল হিসেবে ট্রিট করবো: উপদেষ্টা মাহফুজ

জেমিনাই ২.০ এআই মডেল সবার জন্য উন্মুক্ত

আপডেট সময় : ০৪:২০:৪৭ অপরাহ্ন, রবিবার, ৯ ফেব্রুয়ারী ২০২৫

বিজ্ঞান ও প্রযুক্তি ডেস্ক: নিজেদের ভার্চুয়াল এআই সহকারী জেমিনাইয়ের পরবর্তী প্রজন্ম জেমিনাই ২.০ সবার জন্য খুলে দিয়েছে সার্চ জায়ান্ট গুগল। কোম্পানিটি বলছে, এখন পর্যন্ত তাদের ‘সবচেয়ে কার্যকর’ এআই মডেল স্যুট এটি।

গত ডিসেম্বরে জেমিনাই ২.০ এআই মডেল প্রকাশ করে গুগল। ওই সময় ডেভেলপার ও কিছু বিশ্বস্ত পরীক্ষকের পাশাপাশি নিজেদের কিছু পণ্যে এ এআই মডেলটি জুড়ে দিয়েছিল তারা; যা এআই মডেলটির একটি ‘জেনালের রিলিজ’ ছিল।

নতুন সংস্করণকে ‘জেমিনাই ২.০ ফ্ল্যাশ’ বলছে গুগল। ওই এআই মডেলের টেক্সট, অডিও, ভিডিও ও ইমেজ ইনপুট একসঙ্গে বুঝতে পারার ক্ষমতাকে বলা হচ্ছে মাল্টিমোডালিটি।
সার্চ জায়ান্টটি বলছে, জেমিনাই ২.০ ফ্ল্যাশ মডেল টেক্সট, অডিও, ভিডিও ও ইমেজ ইনপুট বোঝার পাশাপাশি মাল্টিমোডাল আউটপুটও তৈরি করতে পারে, যেমন ছবির সঙ্গে লেখা তৈরি। এতে আরও রয়েছে কোডিং পারফরম্যান্সের জন্য পরীক্ষামূলকভাবে ২.০ প্রো ও ২.০ ফ্ল্যাশ-লাইট, যেটিকে ‘এখনও পর্যন্ত নিজেদের সবচেয়ে সাশ্রয়ী মডেল’ বলে বর্ণনা করেছে তারা।

ওই এআই মডেলট ব্যবহারের জন্য প্রতি ১০ লাখ টোকেনের টেক্সট, ছবি ও ভিডিও ইনপুটের জন্য ১০ সেন্ট খরচ হবে ডেভেলপারদের। অন্যদিকে এআই মডেলটির আরও সাশ্রয়ী সংস্করণ ‘ফ্ল্যাশ-লাইট’সহ ব্যবহারের ক্ষেত্রে তাদের ০.৭৫ সেন্ট খরচ হবে বলে প্রতিবেদনে লিখেছে আমেরিকান সংবাদমাধ্যম সিএনবিবি। এখানে টোকেন বলতে মডেলটি প্রক্রিয়াজাত করে এমন প্রতিটি আলাদা ডেটা ইউনিটকে বোঝায়।

মেটা, অ্যামাজন, মাইক্রোসফট, ওপেনএআই ও অ্যানথ্রোপিকও এআই এজেন্ট বা বিভিন্ন এআইভিত্তিক মডেল তৈরির দিকে এগিয়ে যাচ্ছে; যা ব্যবহারকারীর জন্য জটিল বিভিন্ন কাজ সম্পন্ন করবে। ফলে ব্যবহারকারীদের আলাদা কোনো পদক্ষেপের মধ্য দিয়ে যেতে হবে না। নির্দিষ্ট কাজে বা বিষয়ে বিশেষজ্ঞ হওয়ার জন্য বিশেষভাবে তৈরি করা কৃত্রিম বুদ্ধিমত্তা মডেলকে বলা হচ্ছে এআই এজেন্ট।
গত ডিসেম্বরের এক ব্লগ পোস্টে গুগল লিখেছে, “গত বছর ধরে আমরা আরও এআই এজেন্ট বিকাশে বিনিয়োগ করছি। যার মানে, আপনার আশপাশের জগৎ সম্পর্কে আরও ভালোভাবে বুঝতে পারবে এরা, একাধিক ধাপ এগিয়ে চিন্তা করতে পারবে ও আপনার তত্ত্বাবধানে আপনার হয়ে পদক্ষেপ নেবে এসব মডেল।

জেমিনাই ২.০ মাল্টিমোডালিটিতে নতুন অগ্রগতির পাশাপাশি নেটিভ টুলে ব্যবহারের মাধ্যমে, এটি আমাদের নতুন এআই এজেন্ট তৈরি করতে দেবে; যা আমাদের ‘ইউনিভার্সাল অ্যাসিস্ট্যান্ট তৈরির’ কাছাকাছি নিয়ে যাবে।
সম্প্রতি ‘অপারেটর’ নামে গুগলের মতো একইরকম ফিচার চালু করেছে ওপেনএআই, যা ছুটির পরিকল্পনা, ফর্ম পূরণ, রেস্তোঁরা রিজার্ভেশন ও দোকানে অর্ডার করার মতো বিভিন্ন কাজ স্বয়ংক্রিয়ভাবে করতে পারে।
মাইক্রোসফট সমর্থিত এই স্টার্টআপটি ‘অপারেটর’কে ‘এমন এক এজেন্ট হিসাবে বর্ণনা করেছে; যা ব্যবহারকারীর জন্য কাজ সম্পন্ন করতে ওয়েব ব্রাউজারে পর্যন্ত যেতে পারে’। এছাড়া এ সপ্তাহের শুরুতে ‘ডিপ রিসার্চ’ নামের এআই টুল চালু করেছে ওপেনএআই; যা এআই এজেন্টকে জটিল গবেষণা প্রতিবেদন সংকলন ও ব্যবহারকারীর পছন্দের প্রশ্ন ও নানা বিষয় বিশ্লেষণ করতে সহায়তা করবে।