এএমডি রাইজেন এআই ল্যাপটপের জন্য স্টেবল ডিফিউশন ৩ মিডিয়াম এআই মডেল

এএমডি রাইজেন এআই ল্যাপটপের জন্য স্টেবল ডিফিউশন ৩ মিডিয়াম এআই মডেল

এএমডি (AMD) রাইজেন এআই (Ryzen AI) ল্যাপটপের জন্য নতুন স্টেবল ডিফিউশন ৩ মিডিয়াম এআই মডেল (Stable Diffusion 3 Medium AI Model) চালু করেছে। এটি অফলাইনে ৪ মেগাপিক্সেলের ছবি তৈরি করতে পারে এবং কম র‍্যামে (RAM) উচ্চ মানের আউটপুট দেয়।

স্টেবল ডিফিউশন ৩ মিডিয়াম: এএমডি (AMD) আর্টিফিশিয়াল ইন্টেলিজেন্সের (Artificial Intelligence) ক্ষেত্রে একটি নতুন মাইলফলক স্থাপন করেছে। কোম্পানিটি সম্প্রতি এমন একটি এআই ইমেজ জেনারেশন মডেল (AI image generation model) পেশ করেছে, যা সম্পূর্ণরূপে অফলাইনে চলতে সক্ষম এবং ব্যবহারকারীকে টেক্সট প্রম্পট (text prompt) থেকে ৪-মেগাপিক্সেল পর্যন্ত ছবি তৈরি করতে সক্ষম করে। এই উদ্ভাবনী প্রযুক্তির নাম – স্টেবল ডিফিউশন ৩ মিডিয়াম, যা বিশেষভাবে এএমডি-র রাইজেন এআই ল্যাপটপের জন্য ডিজাইন করা হয়েছে।

স্টেবল ডিফিউশন ৩ মিডিয়াম মডেলটি কী?

এই নতুন এআই মডেলটিকে এএমডি-র তরফে এআই কম্পিউটিং-এ একটি বিপ্লবী পদক্ষেপ হিসেবে মনে করা হচ্ছে। এই মডেলটি এক্সডিএনএ ২ এনপিইউ (XDNA 2 NPU) (নিউর‍্যাল প্রসেসিং ইউনিটস)-এর (Neural Processing Units) জন্য অপটিমাইজ করা হয়েছে এবং বিএফ১৬ (BF16) (ব্লক ফ্লোটিং পয়েন্ট ১৬) (Block Floating Point 16) ফরম্যাট ব্যবহার করে, যার ফলে এটি খুবই কম র‍্যামে উচ্চ-গুণমানের ছবি তৈরি করতে পারে। এর বিশেষত্ব হল এটি একটি অন-ডিভাইস মডেল (on-device model), অর্থাৎ এটি ব্যবহার করার জন্য ইন্টারনেটের কোনও প্রয়োজন হয় না। ডেটা প্রসেসিং (Data processing) সম্পূর্ণরূপে স্থানীয় ডিভাইসে হয়, যা ব্যবহারকারীর গোপনীয়তা বজায় রাখে, পাশাপাশি প্রসেসিংও দ্রুত হয়।

কোন ডিভাইসগুলোতে এই এআই মডেলটি চলবে?

এএমডি-র এই ইমেজ জেনারেশন মডেলটি শুধুমাত্র সেই রাইজেন এআই ল্যাপটপগুলিতেই কাজ করবে যেগুলিতে কমপক্ষে ২৪ জিবি র‍্যাম (24GB RAM) রয়েছে। এছাড়াও, ব্যবহারকারীকে টেনসরস্ট্যাকের (Tensorstack) অ্যামিউজ ৩.১ বিটা ভার্সনও (Amuse 3.1 beta version) ডাউনলোড করতে হবে, যা এই মডেলটিকে চালানোর মাধ্যম।

ইমেজ কোয়ালিটি (Image quality) এবং পারফরম্যান্স (Performance) কেমন?

কোম্পানির দাবি, স্টেবল ডিফিউশন ৩ মিডিয়াম মডেলটি ১০২৪x১০২৪ পিক্সেলের ছবি তৈরি করতে পারে। পরে, এনপিইউ-র (NPU) প্রসেসিং পাওয়ারের (processing power) সাহায্যে এগুলোকে ২০৪৮x২০৪৮ প্রিন্ট-রেডি কোয়ালিটি (print-ready quality) পর্যন্ত আপস্কেল (upscale) করা যেতে পারে। এর ফলে ব্যবহারকারী ইন্টারনেট ছাড়াই স্টক-কোয়ালিটির (stock-quality) ছবি তৈরি করার ক্ষমতা পায়, যা বিশেষভাবে ডিজাইনার (designer) এবং ক্রিয়েটরদের (creator) জন্য খুবই উপযোগী।

মেমরি (Memory) এবং র‍্যামের (RAM) খরচায় বিপ্লবী উন্নতি

এএমডি স্পষ্টভাবে জানিয়েছে যে তারা এই মডেলের মেমরি অপটিমাইজেশনের (memory optimization) উপর বিশেষভাবে মনোযোগ দিয়েছে। আগে যেখানে স্টেবল ডিফিউশন এক্সএল টার্বোর (Stable Diffusion XL Turbo) মতো মডেলের জন্য ৩২ জিবি র‍্যামের (32GB RAM) প্রয়োজন হত, সেখানে এখন এই নতুন মডেলটি শুধুমাত্র ২৪ জিবি র‍্যামেই (24GB RAM) চলে। শুধু তাই নয়, অ্যাক্টিভ ইমেজ জেনারেশনের (active image generation) সময় এটি শুধুমাত্র ৯ জিবি র‍্যাম (9GB RAM) ব্যবহার করে, যা এটিকে খুবই মেমরি-এফিশিয়েন্ট (memory-efficient) করে তোলে। এটা সম্ভব হয়েছে বিএফ১৬ (BF16) ফরম্যাটের ব্যবহারের (format use) ফলে, যা কম মেমরিতেও (memory) আরও ভালো পারফরম্যান্স (performance) দেয়।

প্রম্পট সিস্টেম (Prompt system): আরও ভালো কন্ট্রোল (control), আরও ভালো আউটপুট (output)

এএমডি জানিয়েছে যে এর মডেল প্রম্পট (prompt), গঠন এবং ক্রমকে কঠোরভাবে অনুসরণ করে। অর্থাৎ, ব্যবহারকারীকে ছবি তৈরি করার সময় প্রথমে বিষয়, তারপর গঠনমূলক উপাদান এবং শেষে বিবরণ দিতে হয়। এর ফলে মডেল আরও বেশি নির্ভুল এবং কাঙ্ক্ষিত ফলাফল দেয়। এছাড়াও, নেগেটিভ প্রম্পটিংও (Negative Prompting) সাপোর্ট (support) করে, যার মাধ্যমে আপনি ছবি থেকে অবাঞ্ছিত উপাদান সরিয়ে দিতে পারেন। মনে রাখার মতো বিষয় হল প্রম্পটের (prompt) শেষে ব্যবহৃত ফুলস্টপও (full stop) মডেলের কনটেক্সট (context) বুঝতে প্রভাবিত করতে পারে।

টেনসরস্ট্যাক অ্যামিউজ ৩.১ অ্যাপ (Tensorstack Amuse 3.1 App): নতুন এআই হাব (AI Hub)

নতুন স্টেবল ডিফিউশন মডেলটি (Stable Diffusion model), টেনসরস্ট্যাক (Tensorstack) দ্বারা তৈরি করা অ্যামিউজ ৩.১ ডেস্কটপ অ্যাপের (Amuse 3.1 desktop app) একটি অংশ, যা এএমডি রাইজেন এআই ল্যাপটপের (AMD Ryzen AI laptop) জন্য বিনামূল্যে ডাউনলোড করা যেতে পারে। এই অ্যাপটি শুধু এই মডেলটিকে চালানোর মাধ্যমই নয়, এর মধ্যে অন্যান্য এআই টুলসও (AI tools) রয়েছে, যা ক্রিয়েটিভিটিকে (creativity) নতুন উচ্চতায় নিয়ে যেতে পারে।

কেন এই টেকনোলজি (technology) বিশেষ?

  • ইন্টারনেট ফ্রি মডেল – ডেটা সম্পূর্ণরূপে ডিভাইসেই প্রসেস (process) হয়।
  • আরও ভালো গোপনীয়তা – ক্লাউডে (cloud) আপলোড করার প্রয়োজন নেই।
  • কম র‍্যামে (RAM) হাই কোয়ালিটি (high quality) – বিএফ১৬ (BF16) ফরম্যাটের (format) কারণে কম মেমরিতেও (memory) চমৎকার আউটপুট (output)।
  • প্রিন্ট-রেডি আউটপুট – ৪ মেগাপিক্সেল (megapixel) পর্যন্ত ছবি সম্ভব।
  • প্রম্পট (prompt) ভিত্তিক নিয়ন্ত্রণ – ব্যবহারকারী আউটপুটের (output) উপর আরও বেশি নিয়ন্ত্রণ পায়।

Leave a comment