Character.AI-এর নতুন AI প্রযুক্তি: TalkingMachines, ভার্চুয়াল জগতে নতুন দিগন্ত

Character.AI-এর নতুন AI প্রযুক্তি: TalkingMachines, ভার্চুয়াল জগতে নতুন দিগন্ত

AI চ্যাটবট প্ল্যাটফর্ম Character.AI তাদের নতুন AI প্রযুক্তি TalkingMachines চালু করেছে। এটি একটি উন্নত ডিফিউশন মডেল, যা রিয়েল-টাইম, অডিও-চালিত, ফেসটাইম-এর মতো ইন্টারেক্টিভ ভিডিও তৈরি করতে সক্ষম।

TalkingMachines: এআই চ্যাটবট এবং ভার্চুয়াল ক্যারেক্টার প্রযুক্তিতে অগ্রণী Character.AI তাদের লেটেস্ট উদ্ভাবন TalkingMachines ঘোষণা করেছে, যা ডিজিটাল ইন্টারেক্টিভ বিনোদনের জগতে নতুন দিগন্ত উন্মোচন করেছে। এই প্রযুক্তির মাধ্যমে এআই-জেনারেটেড ক্যারেক্টাররা এখন কেবল লিখিত শব্দ নয়, বরং লাইভ ভিডিওতে আপনার মতো কথা বলবে এবং অঙ্গভঙ্গি প্রদর্শন করবে। Character.AI-এর দাবি, এই ফিচার রোল-প্লে, স্টোরিটেলিং, গেমিং এবং ভার্চুয়াল সামাজিক মিথস্ক্রিয়ার ভবিষ্যৎকে সম্পূর্ণ পরিবর্তন করে দেবে।

TalkingMachines আসলে কী?

TalkingMachines মূলত একটি ডিফিউশন ট্রান্সফরমার (DiT)-ভিত্তিক ভিডিও জেনারেশন সিস্টেম, যা অ্যাসিমেট্রিক নলেজ ডিসটিলেশন (Asymmetric Knowledge Distillation) প্রযুক্তি ব্যবহার করে। এর মানে হল, এই মডেল যেকোনো ছবি এবং ভয়েস সিগন্যাল থেকে লাইভ ভিডিও তৈরি করতে সক্ষম। ব্যবহারকারী কথা বলার সাথে সাথেই, এই সিস্টেমটি অডিও শুনে রিয়েল-টাইমে সেই চরিত্রের মুখ, চোখ, মুখ এবং মাথার নড়াচড়াকে পুরোপুরি সিঙ্ক্রোনাইজ করে।

Character.AI-এর মতে, এর ফলে চরিত্রের অভিব্যক্তি, চিত্রের গুণমান এবং স্টাইলে কোনো ধরনের অবনতি হয় না। তা সে নীরবতা হোক, হঠাৎ আওয়াজ হোক বা ধীরে কথা বলা – এই মডেল প্রতিটি বিরতি, প্রতিটি স্বর এবং প্রতিটি শব্দকে এত সূক্ষ্মভাবে ধরে রাখে যে দর্শকদের আসল মানুষের মতো অনুভব হয়।

অডিওর জন্য শক্তিশালী ১.২ বিলিয়ন প্যারামিটার মডিউল

Character.AI এই প্রযুক্তিকে সমর্থন করার জন্য ১.২ বিলিয়ন প্যারামিটার বিশিষ্ট একটি উন্নত অডিও মডিউলও তৈরি করেছে। এটি কেবল শব্দগুলিকেই নয়, বরং কণ্ঠস্বরের নীরবতা, শ্বাস-প্রশ্বাসের ব্যবধান এবং মাইক্রো-এক্সপ্রেশনগুলিকেও সনাক্ত করতে পারে। কোম্পানির দাবি, এই সিস্টেম কোনো গুণগত ক্ষতি ছাড়াই সীমাহীন দৈর্ঘ্যের ভিডিও তৈরি করতে পারে।

সমর্থিত শৈলী: ভার্চুয়াল জগতের কোনো সীমা নেই

TalkingMachines বৈশিষ্ট্যটি বিভিন্ন শৈলী সমর্থন করে, যার মধ্যে রয়েছে:

  • ফটো-রিয়ালিস্টিক হিউম্যান ক্যারেক্টার
  • এনিমে-স্টাইল অবতার
  • 3D কার্টুন/গেমিং ক্যারেক্টার

অর্থাৎ, একটি ছবি পাঠান, আপনার ভয়েস দিন এবং এআই সেই চরিত্রটিকে অ্যানিমেট করবে যেন সে আপনার সামনে লাইভ কথা বলছে। রোল-প্লে, স্টোরিটেলিং, ফ্যান-ফিকশন, গেমিং অবতার অথবা সোশ্যাল মেটাভার্স – সকলের জন্য এই প্রযুক্তি একটি আশীর্বাদস্বরূপ।

কেন একে গেম-চেঞ্জার বলা হচ্ছে?

আসলে, এতদিন এআই চ্যাটবটগুলি কেবল টেক্সট বা ভয়েস ইন্টারঅ্যাকশন পর্যন্ত সীমাবদ্ধ ছিল। কিন্তু এখন Character.AI-এর এই পদক্ষেপের মাধ্যমে ভার্চুয়াল জগতে মানবিক অঙ্গভঙ্গি এবং আবেগপূর্ণ অভিব্যক্তিও যুক্ত হবে। মানুষ যত বেশি ভার্চুয়াল রিয়েলিটি এবং মেটাভার্সে সময় কাটাচ্ছে, TalkingMachines-এর মতো বৈশিষ্ট্যগুলি সেখানে বিদ্যমান এআই চরিত্রগুলিকে আরও বাস্তবসম্মত, আকর্ষণীয় এবং ইন্টারেক্টিভ করে তুলবে।

সৃজনশীল শিল্পও পাবে দারুণ সুবিধা

চলচ্চিত্র, অ্যানিমেশন, ইউটিউব স্টোরিটেলিং এবং গেম ডিজাইনেও এই প্রযুক্তির বিপ্লবী প্রভাব পড়তে পারে। সৃজনশীল ব্যক্তিরা এখন ব্যয়বহুল ভিএফএক্স বা মোশন-ক্যাপচার প্রযুক্তি ছাড়াই কেবল একটি ছবি এবং শব্দ ব্যবহার করে প্রাণবন্ত চরিত্র তৈরি করতে পারবেন। Character.AI-এর মতে, এই প্রযুক্তি নির্মাতা, গেম ডেভেলপার এবং ডিজিটাল আর্টিস্টদের অসাধারণ স্বাধীনতা দেবে। ফ্যান্টাসি, হরর বা কমেডি – যেকোনো জেনারে মিনিটের মধ্যে এমন একটি চরিত্র তৈরি করা সম্ভব হবে যা কথা বলতে এবং নড়াচড়া করতে পারে, যা এত দিন শুধুমাত্র বড় প্রোডাকশন হাউসগুলিই করতে পারত।

ডেটা গোপনীয়তা এবং নীতিশাস্ত্রের উপরও নজর

Character.AI নিশ্চিত করেছে যে ব্যবহারকারীদের দেওয়া ছবি এবং ভয়েস ডেটা সুরক্ষিত রাখা হবে এবং এটি কোনো তৃতীয় পক্ষের সাথে শেয়ার করা হবে না। এছাড়াও, কোম্পানি এই প্রযুক্তির অপব্যবহার, বিশেষ করে ডিপফেক বা মিথ্যা তথ্যের প্রসারের বিরুদ্ধে ব্যবস্থা নেওয়ার জন্য কাজ করছে।

প্রযুক্তি বিশেষজ্ঞরা মনে করছেন, TalkingMachines আগামী দিনে ভার্চুয়াল যোগাযোগ, গেমিং এবং ডিজিটাল বিনোদনের চেহারা পরিবর্তন করে দেবে। মানুষের মতো অভিব্যক্তি এবং কণ্ঠের সাথে এআই ক্যারেক্টার এখন কোনো গল্প বা গেমে রিয়েল প্লেয়ারের মতো অংশ হবে।

Leave a comment