কণ্ঠস্বর হুবহু নকল করবে মাইক্রোসফটের নতুন কৃত্রিম বুদ্ধিমত্তা

 






নতুন এক ধরনের কৃত্রিম বুদ্ধিমত্তা মডেল নিয়ে গবেষণা করছে মাইক্রোসফট। মানুষের কণ্ঠস্বর হুবহু নকল করবে এই মডেলটি। অন্যান্য পরিষেবা গুলো কণ্ঠস্বর নকল করতে যথেষ্ট পরিমাণে ভয়েস ইনপুট নিলেও মাইক্রোসফটের এই কৃত্রিম বুদ্ধিমত্তা মডেলটি মাত্র ৩ সেকেন্ডের অডিও নমুনা থেকেও কারও কণ্ঠস্বর হুবহু নকল করতে পারে। এআই মডেলটির নাম ‘ভাল-ই’।


প্রযুক্তিবিষয়ক সাইট এনগ্যাজেটের প্রতিবেদন অনুযায়ী, এটি মাইক্রোসফটের ‘টেক্সট-টু-স্পিচ’ ফিচারে ব্যবহার করা যাবে। কৃত্রিম বুদ্ধিমত্তা মডেলটি শুধু কণ্ঠস্বর নকল করতে পারে তা নয়, বক্তার কণ্ঠের আবেগও হুবহু ফুটিয়ে তুলতে পারে।


ভবিষ্যতে কাস্টমাইজ করা বা উচ্চমানের ‘টেক্সট-টু-স্পিচ’ অ্যাপ্লিকেশনে এটি ব্যবহারের সম্ভাবনা থাকলেও, ‘ডিপফেইক’ কৃত্রিম বুদ্ধিমত্তা প্রযুক্তির মতো এটিও অপব্যবহারের ঝুঁকি রয়েছে। ‘ভাল-ই’কে মাইক্রোসফট আখ্যা দিয়েছে একটি ‘নিউরাল কোডেক ল্যাংগুয়েজ মডেল’ হিসেবে। এক গবেষণা পত্রে কৃত্রিম বুদ্ধিমত্তা মডেলটির গবেষকেরা ব্যাখ্যা করেন তারা কীভাবে প্রযুক্তি জায়ান্ট মেটার ‘লিব্রিলাইট’ নামক অডিও লাইব্রেরিতে থাকা সাত হাজারের বেশি বক্তার ৬০ হাজার ঘণ্টা দীর্ঘ ইংরেজি ভাষায় দেওয়া বক্তব্যের মাধ্যমে ‘ভাল-ই’ কে প্রশিক্ষণ দিয়েছেন।


সম্প্রতি, মাইক্রোসফট ওয়ার্ড, পাওয়ার পয়েন্ট এবং আউটলুক সফটওয়্যার গুলিতে মাইক্রোসফট ওপেনএআই-এর কৃত্রিম বুদ্ধিমত্তা প্রযুক্তি পরীক্ষা করছে বলে জানা গিয়েছে। মাইক্রোসফট পরীক্ষা করে দেখছে যে, কীভাবে এই এআই মডেলগুলি ই-মেইলের উত্তরের পরামর্শ দিতে পারে বা ওয়ার্ড ব্যবহারকারীদের লেখার উন্নতিতে পরামর্শ দিতে পারে। ওপেনএআই’ যুক্তরাষ্ট্রভিত্তিক একটি কৃত্রিম বুদ্ধিমত্তা গবেষণা প্রতিষ্ঠান।


এর আগে, নিজস্ব সার্চ ইঞ্জিন ‘বিং’-এর নতুন সংস্করণে কৃত্রিম বুদ্ধিমত্তা (এআই) যুক্ত করার ঘোষণা দিয়েছিল মাইক্রোসফট। এতে ব্যবহার করা হবে ওপেনএআই কোম্পানির চ্যাটবট ‘চ্যাটজিপিটি’। আগামী মার্চের শেষ নাগাদ নতুন এই ফিচার চালু করার সম্ভাবনা রয়েছে।


২০১৯ সালে স্যান ফ্রান্সিসকো ভিত্তিক এআই কোম্পানি ওপেনএআইয়ে ১০০ কোটি ডলার বিনিয়োগ করেছিল মাইক্রোসফট। মাইক্রোসফটের ‘অ্যাজ্যুর’ ক্লাউড কম্পিউটিং সেবায় কৃত্রিম বুদ্ধিমত্তার ‘সুপার কম্পিউটিং’ প্রযুক্তি বানাতে একসঙ্গে কাজ করে কোম্পানি দুটি। একই বছর এক ব্লগ পোস্টে মাইক্রোসফট জানিয়েছিল, ওপেনএআইয়ের ‘ডাল-ই ২’ নামে পরিচিত ‘ইমেজ-জেনারেশন’ সফটওয়্যারকে বিং সার্চ ইঞ্জিনে একীভূত করার পরিকল্পনা করছে প্রতিষ্ঠানটি।

Comments