Google-এর Veo 3: ছবি থেকে এআই ভিডিও তৈরির নতুন দিগন্ত

Google-এর Veo 3: ছবি থেকে এআই ভিডিও তৈরির নতুন দিগন্ত

Google, Gemini-তে Veo 3 আপগ্রেড করে ছবি থেকে ভিডিও তৈরি করার ক্ষমতা যোগ করেছে। এখন ব্যবহারকারীরা একটি ছবি এবং টেক্সট প্রম্পট দিয়ে এআই ভিডিও তৈরি করতে পারবে। এই বৈশিষ্ট্যটি বর্তমানে কেবল ওয়েবে উপলব্ধ এবং ভারতে চালু হয়নি।

Google: Google তাদের জেনারেটিভ এআই ক্ষমতা আরও উন্নত করে Veo 3 মডেলটিকে একটি নতুন বিপ্লবী শক্তি দিয়ে আপগ্রেড করেছে। এখন ব্যবহারকারীরা Gemini ওয়েব ইন্টারফেসের মাধ্যমে শুধুমাত্র একটি ছবি এবং টেক্সট প্রম্পট ব্যবহার করে ভিডিও তৈরি করতে পারবে। এই বৈশিষ্ট্য যুক্ত হওয়ার ফলে, Google শুধুমাত্র টেক্সট এবং ইমেজ জেনারেশন এর ক্ষেত্রেই নয়, ভিডিও নির্মাণেও অগ্রণী ভূমিকা পালন করছে। এই প্রযুক্তি বর্তমানে মোবাইল অ্যাপগুলিতে উপলব্ধ নয়, তবে Google এটিকে নির্বাচিত দেশগুলিতে Gemini ওয়েব ইন্টারফেসের মাধ্যমে সর্বজনীন করছে। যদিও, ভারত এখনও এর নাগালের বাইরে রয়েছে।

ছবি থেকে ভিডিও: কিভাবে কাজ করবে Veo 3?

Veo 3-এর নতুন আপডেটে ব্যবহারকারী একটি রেফারেন্স ছবি (Reference Image) যোগ করার অনুমতি পায়, সেইসাথে একটি টেক্সট প্রম্পট, যেখানে বর্ণনা করা হয় যে ছবিতে কী কী পরিবর্তন বা অ্যানিমেশন হওয়া উচিত। এই টেক্সট এবং ছবি একসাথে Veo 3-কে নির্দেশ দেয় যে ভিডিওতে কী দেখানো হবে। উদাহরণস্বরূপ, আপনি যদি একটি পাহাড়ের ছবি দেন এবং প্রম্পটে লেখেন, 'সূর্য উঠছে, পাখি উড়ছে, এবং একটি শিশু আরোহণ করছে', তাহলে Veo 3 এই নির্দেশ অনুসারে ভিডিও তৈরি করতে পারে। অর্থাৎ, এখন আপনার কল্পনাগুলি কেবল শব্দগুলিতে সীমাবদ্ধ নয় — একটি ছবি এবং ধারণা থেকে একটি প্রভাবশালী ভিডিও তৈরি করা যেতে পারে।

Gemini-তে নতুন বৈশিষ্ট্যটি কোথায় পাওয়া যাবে?

যে ব্যবহারকারীরা Gemini ব্যবহার করছেন, তারা ওয়েব ব্রাউজারে গিয়ে টেক্সট বক্সের ঠিক নিচে একটি "ভিডিও" ট্যাব দেখতে পারবেন। এই ট্যাবে ক্লিক করার সাথে সাথেই ব্যবহারকারী একটি নতুন বিকল্প পাবেন — ছবি যোগ করার। এখানে ব্যবহারকারী একটি ছবি আপলোড করতে পারবেন এবং এর সাথে টেক্সট প্রম্পট দিতে পারবেন। এর পরে, Veo 3 মডেল সেই ছবি এবং টেক্সটের ভিত্তিতে স্বয়ংক্রিয়ভাবে ভিডিও তৈরি করবে।

ডেমো সবাইকে অবাক করেছে

Google একটি আকর্ষণীয় ডেমো ভিডিও প্রকাশ করেছে, যেখানে তারা Veo 3-এর আসল ক্ষমতা দেখিয়েছে। এই ডেমোতে একটি সাধারণ কার্ডবোর্ড বক্সের ছবি ব্যবহার করা হয়েছে এবং তার উপর তিনটি ভিন্ন ভিডিও তৈরি করা হয়েছে:

  1. বক্সের ভিতরে খাবার তৈরি করছে একটি হ্যামস্টার।
  2. বক্সে লাফ দিচ্ছে একজন মানুষ।
  3. বক্স থেকে একটি লিফট বের হচ্ছে।

এই ডেমোটি প্রমাণ করেছে যে Veo 3 কেবল সাধারণ মুভমেন্টই নয়, বরং জটিল এবং শৈল্পিক অ্যানিমেশনও তৈরি করতে পারে।

নিরাপত্তাও সম্পূর্ণভাবে নিশ্চিত করা হয়েছে

Google এই নতুন বৈশিষ্ট্যে স্বচ্ছতা এবং নিরাপত্তার উপর বিশেষ জোর দিয়েছে।

  • প্রতিটি ভিডিওতে একটি দৃশ্যমান ওয়াটারমার্ক যোগ করা হয়েছে যা নির্দেশ করে যে ভিডিওটি এআই দ্বারা তৈরি করা হয়েছে।
  • এছাড়াও, Google-এর SynthID প্রযুক্তির মাধ্যমে প্রতিটি ভিডিওতে একটি অদৃশ্য ওয়াটারমার্কও যুক্ত করা হয়েছে, যা কেউ ক্রপ, এডিট বা মুছে ফেলতে পারবে না।

এই প্রযুক্তি ভবিষ্যতে Deepfake বা জাল ভিডিও সনাক্তকরণে সহায়ক হতে পারে, যা ডিজিটাল বিশ্বের জন্য একটি অত্যন্ত প্রয়োজনীয় পদক্ষেপ।

এই বৈশিষ্ট্যটি কোন কোন ক্ষেত্রে উপযোগী হতে পারে?

Google Veo 3-এর এই ইমেজ-টু-ভিডিও বৈশিষ্ট্যটি কেবল একটি উন্নতি নয়, এআই জেনারেটিভ মিডিয়ার ভবিষ্যৎ। এই বৈশিষ্ট্যটি অ্যানিমেশন, বিজ্ঞাপন, গেমিং এবং এমনকি শিক্ষার ক্ষেত্রেও নতুন সম্ভাবনা তৈরি করতে পারে।

  • শিক্ষায়: একটি ছবি থেকে জটিল ধারণা ভিডিওতে রূপান্তরিত করে শিশুদের সহজে বোঝানো যেতে পারে।
  • মার্কেটিং-এ: পণ্যের একটি ছবি থেকে প্রভাবশালী ভিডিও বিজ্ঞাপন তৈরি করা যেতে পারে।
  • বিনোদন-এ: চলচ্চিত্র পরিচালক এবং লেখকরা তাদের গল্পগুলিকে ভিজ্যুয়াল আকারে দ্রুত তৈরি করতে পারেন।

ভবিষ্যতের সম্ভাবনা

Veo 3-এর এই ক্ষমতা ভবিষ্যতে আরও উন্নত হতে পারে। ভবিষ্যতে:

  • ব্যবহারকারীরা দীর্ঘ ভিডিও স্টোরি তৈরি করতে পারবে।
  • বিভিন্ন অ্যাঙ্গেল থেকে ছবি এবং মুভমেন্ট নিয়ন্ত্রণ করা যাবে।
  • মোবাইল অ্যাপগুলিতেও এই বৈশিষ্ট্য যোগ করা যেতে পারে।

Google-এর এই উদ্যোগ OpenAI, Runway এবং Pika Labs-এর মতো ভিডিও জেনারেশন প্ল্যাটফর্মগুলির সাথে সরাসরি প্রতিযোগিতা করছে।

Leave a comment