ঢাকা ১১:২৯ অপরাহ্ন, শনিবার, ৩০ নভেম্বর ২০২৪, ১৬ অগ্রহায়ণ ১৪৩১ বঙ্গাব্দ

কখনোই শোনা যায়নি এমন শব্দও বানাবে এআই

  • আপডেট সময় : ০৮:০১:২৩ অপরাহ্ন, বুধবার, ২৭ নভেম্বর ২০২৪
  • ২১ বার পড়া হয়েছে

প্রযুক্তি ডেস্ক : সম্প্রতি এক নতুন এআই অডিও জেনারেটর তৈরি করেছেন গবেষকরা। তাদের দাবি, এটি এমন ধরনের শব্দ তৈরি করতে পারে, যা আগে কখনও শোনা যায়নি। নতুন এই জেনারেটিভ কৃত্রিম বুদ্ধিমত্তা মডেলটিকে ‘ফুগাত্তো’ নামে বর্ণনা করেছেন গবেষকরা। এই টুল তৈরি করেছে মার্কিন কম্পিউটার চিপ জায়ান্ট এনভিডিয়া’র একটি দল। এ গবেষণা দলটি মূলত তৈরি করতে চেয়েছিল ‘শব্দের জন্য এক ধরনের সুইস আর্মি নাইফ’।
টুলটিতে টেক্সট বা লিখিত আকারে নির্দেশনা দিয়ে যে কোনো ধরনের অডিও তৈরি বা এডিট করতে পারবেন ব্যবহারকারীরা। যেমন-গান থেকে কোনও নির্দিষ্ট অংশের সুর সরিয়ে ফেলা বা কারও কণ্ঠের উচ্চারণ পরিবর্তন করার কাজ। ফুগাত্তো’র বিশদ বিবরণ দিয়ে এক ব্লগ পোস্টে এনভিডিয়া’র মিডিয়া ও বিনোদনের দায়িত্বে থাকা ভাইস প্রেসিডেন্ট রিচার্ড কেরিস দাবি করেছেন, অন্য যে কোনও এআই মডেলের চেয়ে সক্ষমতা অনেক বেশি ফুগাত্তো’র। একইসঙ্গে একেবারে নতুন শব্দ তৈরির মাধ্যমে সংগীতে বিপ্লব ঘটানোর সম্ভাবনাও রয়েছে নতুন এআই টুলটির। “এই টুলের মাধ্যমে স্যাক্সোফোন বা যে কোনো বাদ্যযন্ত্রের সুর তৈরি করতে পারবেন ব্যবহারকারীরা। মানে ব্যবহারকারীরা যা বর্ণনা করে দেবেন এআই মডেলটি তা-ই তৈরি করে দেবে।” এদিকে, এক ভিডিওতে পাঠ্য বা টেক্সট প্রম্পট থেকে অনন্য এক অডিও নমুনা তৈরি করতে দেখা গেছে ফুগাত্তো’কে, যেখানে টুলটি ট্রেনের শব্দকে স্ট্রিং অর্কেস্ট্রায় পরিবর্তন করেছে বলে প্রতিবেদনে লিখেছে ব্রিটিশ দৈনিক ইন্ডিপেনডেন্ট।
“শব্দ আমার অনুপ্রেরণা। আর এ বিষয়টিই আমাকে সংগীত তৈরিতে অনুপ্রাণিত করে চলেছে। স্টুডিওতে গিয়ে আমি একেবারে নতুন শব্দ তৈরি করে ফেলবো– এ এক অবিশ্বাস্য আইডিয়া,” বলেছেন এনভিডিয়া’র ইনসেপশন প্রোগ্রামের অংশ এবং প্রযোজক ও গীতিকার ইডো জিমিশলানি। ফুগাত্তো’কে তৈরি করতে এক বছরেরও বেশি সময় লেগেছে। পাশাপাশি এআই টুলটিকে প্রশিক্ষণ দিতে প্রয়োজন হয়েছে কয়েক মিলিয়ন অডিও নমুনার। অডিও প্রযুক্তিতে দ্রুত অগ্রগতি এনেছে জেনারেটিভ এআই। ফলে এ বিষয়টি সৃজনশীল মানুষদের কীভাবে প্রভাবিত করতে যাচ্ছে তা নিয়ে দেখা দিয়েছে উদ্বেগ। এ বছরের শুরুর দিকে ‘অস্ট্রেলিয়ান অ্যাসোসিয়েশন অফ ভয়েস অ্যাক্টরস’ দেশটির এক পার্লামেন্টারি কমিটিকে সতর্ক করে বলেছিল, বিভিন্ন প্রযুক্তি কোম্পানি যদি এআই ব্যবহারের ক্ষেত্রে বিকল্প ব্যবস্থা না নেয় তবে শিগগিরই চাকরি হারাতে পারে আনুমানিক পাঁচ হাজার স্থানীয় বাচিক শিল্পী। সম্প্রতি বিভিন্ন শিল্পীর সংগীতের প্রতিলিপি তৈরির অভিযোগে বিভিন্ন এআই টুলের বিরুদ্ধে মামলা শুরু করেছে যুক্তরাষ্ট্রের ‘রেকর্ডিং ইন্ডাস্ট্রি অ্যাসোসিয়েশন অফ আমেরিকা’। তবে এর পরও কিছু শিল্পী দাবি করেছেন, সংগীতের আরেকটি বিবর্তন ধারার প্রতিনিধিত্ব করবে এআই, যা নিয়ে আসবে এক নতুন সৃজনশীল সম্ভাবনা। “সংগীতের ইতিহাসও প্রযুক্তির ইতিহাস, যা ইলেকট্রিক গিটারের মাধ্যমে বিশ্বকে দিয়েছে রক অ্যান্ড রোল ঘরনার গান,” বলেছেন জিমিশলানি। “এআইয়ের মাধ্যমে আমরা সংগীতের পরবর্তী অধ্যায় লিখছি। এক নতুন যন্ত্র পেয়েছি আমরা, যা সংগীত তৈরির এক নতুন টুল। আর এটি বিস্ময়কর এক ঘটনা।”

 

 

যোগাযোগ

সম্পাদক : ডা. মোঃ আহসানুল কবির, প্রকাশক : শেখ তানভীর আহমেদ কর্তৃক ন্যাশনাল প্রিন্টিং প্রেস, ১৬৭ ইনার সার্কুলার রোড, মতিঝিল থেকে মুদ্রিত ও ৫৬ এ এইচ টাওয়ার (৯ম তলা), রোড নং-২, সেক্টর নং-৩, উত্তরা মডেল টাউন, ঢাকা-১২৩০ থেকে প্রকাশিত। ফোন-৪৮৯৫৬৯৩০, ৪৮৯৫৬৯৩১, ফ্যাক্স : ৮৮-০২-৭৯১৪৩০৮, ই-মেইল : [email protected]
আপলোডকারীর তথ্য

মহান বিজয়ের মাস শুরু

কখনোই শোনা যায়নি এমন শব্দও বানাবে এআই

আপডেট সময় : ০৮:০১:২৩ অপরাহ্ন, বুধবার, ২৭ নভেম্বর ২০২৪

প্রযুক্তি ডেস্ক : সম্প্রতি এক নতুন এআই অডিও জেনারেটর তৈরি করেছেন গবেষকরা। তাদের দাবি, এটি এমন ধরনের শব্দ তৈরি করতে পারে, যা আগে কখনও শোনা যায়নি। নতুন এই জেনারেটিভ কৃত্রিম বুদ্ধিমত্তা মডেলটিকে ‘ফুগাত্তো’ নামে বর্ণনা করেছেন গবেষকরা। এই টুল তৈরি করেছে মার্কিন কম্পিউটার চিপ জায়ান্ট এনভিডিয়া’র একটি দল। এ গবেষণা দলটি মূলত তৈরি করতে চেয়েছিল ‘শব্দের জন্য এক ধরনের সুইস আর্মি নাইফ’।
টুলটিতে টেক্সট বা লিখিত আকারে নির্দেশনা দিয়ে যে কোনো ধরনের অডিও তৈরি বা এডিট করতে পারবেন ব্যবহারকারীরা। যেমন-গান থেকে কোনও নির্দিষ্ট অংশের সুর সরিয়ে ফেলা বা কারও কণ্ঠের উচ্চারণ পরিবর্তন করার কাজ। ফুগাত্তো’র বিশদ বিবরণ দিয়ে এক ব্লগ পোস্টে এনভিডিয়া’র মিডিয়া ও বিনোদনের দায়িত্বে থাকা ভাইস প্রেসিডেন্ট রিচার্ড কেরিস দাবি করেছেন, অন্য যে কোনও এআই মডেলের চেয়ে সক্ষমতা অনেক বেশি ফুগাত্তো’র। একইসঙ্গে একেবারে নতুন শব্দ তৈরির মাধ্যমে সংগীতে বিপ্লব ঘটানোর সম্ভাবনাও রয়েছে নতুন এআই টুলটির। “এই টুলের মাধ্যমে স্যাক্সোফোন বা যে কোনো বাদ্যযন্ত্রের সুর তৈরি করতে পারবেন ব্যবহারকারীরা। মানে ব্যবহারকারীরা যা বর্ণনা করে দেবেন এআই মডেলটি তা-ই তৈরি করে দেবে।” এদিকে, এক ভিডিওতে পাঠ্য বা টেক্সট প্রম্পট থেকে অনন্য এক অডিও নমুনা তৈরি করতে দেখা গেছে ফুগাত্তো’কে, যেখানে টুলটি ট্রেনের শব্দকে স্ট্রিং অর্কেস্ট্রায় পরিবর্তন করেছে বলে প্রতিবেদনে লিখেছে ব্রিটিশ দৈনিক ইন্ডিপেনডেন্ট।
“শব্দ আমার অনুপ্রেরণা। আর এ বিষয়টিই আমাকে সংগীত তৈরিতে অনুপ্রাণিত করে চলেছে। স্টুডিওতে গিয়ে আমি একেবারে নতুন শব্দ তৈরি করে ফেলবো– এ এক অবিশ্বাস্য আইডিয়া,” বলেছেন এনভিডিয়া’র ইনসেপশন প্রোগ্রামের অংশ এবং প্রযোজক ও গীতিকার ইডো জিমিশলানি। ফুগাত্তো’কে তৈরি করতে এক বছরেরও বেশি সময় লেগেছে। পাশাপাশি এআই টুলটিকে প্রশিক্ষণ দিতে প্রয়োজন হয়েছে কয়েক মিলিয়ন অডিও নমুনার। অডিও প্রযুক্তিতে দ্রুত অগ্রগতি এনেছে জেনারেটিভ এআই। ফলে এ বিষয়টি সৃজনশীল মানুষদের কীভাবে প্রভাবিত করতে যাচ্ছে তা নিয়ে দেখা দিয়েছে উদ্বেগ। এ বছরের শুরুর দিকে ‘অস্ট্রেলিয়ান অ্যাসোসিয়েশন অফ ভয়েস অ্যাক্টরস’ দেশটির এক পার্লামেন্টারি কমিটিকে সতর্ক করে বলেছিল, বিভিন্ন প্রযুক্তি কোম্পানি যদি এআই ব্যবহারের ক্ষেত্রে বিকল্প ব্যবস্থা না নেয় তবে শিগগিরই চাকরি হারাতে পারে আনুমানিক পাঁচ হাজার স্থানীয় বাচিক শিল্পী। সম্প্রতি বিভিন্ন শিল্পীর সংগীতের প্রতিলিপি তৈরির অভিযোগে বিভিন্ন এআই টুলের বিরুদ্ধে মামলা শুরু করেছে যুক্তরাষ্ট্রের ‘রেকর্ডিং ইন্ডাস্ট্রি অ্যাসোসিয়েশন অফ আমেরিকা’। তবে এর পরও কিছু শিল্পী দাবি করেছেন, সংগীতের আরেকটি বিবর্তন ধারার প্রতিনিধিত্ব করবে এআই, যা নিয়ে আসবে এক নতুন সৃজনশীল সম্ভাবনা। “সংগীতের ইতিহাসও প্রযুক্তির ইতিহাস, যা ইলেকট্রিক গিটারের মাধ্যমে বিশ্বকে দিয়েছে রক অ্যান্ড রোল ঘরনার গান,” বলেছেন জিমিশলানি। “এআইয়ের মাধ্যমে আমরা সংগীতের পরবর্তী অধ্যায় লিখছি। এক নতুন যন্ত্র পেয়েছি আমরা, যা সংগীত তৈরির এক নতুন টুল। আর এটি বিস্ময়কর এক ঘটনা।”