সোরা এআই (Sora AI) কী? OpenAI এর টেক্সট-টু-ভিডিও জেনারেটর টুল কীভাবে কাজ করে?

Level 15
কন্টেন্ট রাইটার, টেল টেক আইটি, গাইবান্ধা

সাম্প্রতিক সময়ের সবচেয়ে জনপ্রিয় এবং শক্তিশালী এআই টুল ChatGPT ২০২২ সালের ৩০ নভেম্বর প্রকাশিত হয়। এটি রিলিজ হওয়ার পর থেকে প্রযুক্তি বিশ্বে অনেক বেশি আলোচনার জন্ম দেয়। ‌আর এর কারণ হলো, এটি মানুষের বিভিন্ন Text Prompt থেকে যথাযথ ও আকর্ষণীয় রেসপন্স দিতে পারে।

OpenAI এর চ্যাটজিপিটি সত্যিকার অর্থেই এআই এর জগতে একটি নতুন বিপ্লব নিয়ে এসেছে। অন্যান্যদের মতো আপনিও হয়তোবা ইতিমধ্যেই ChatGPT ব্যবহার করে থাকতে পারেন। ‌বর্তমান সময়ের এটি একটি জনপ্রিয় এবং বহুল ব্যবহৃত এআই টুল। কিন্তু এর মধ্যেই আমাদের সামনে আরো একটি শক্তিশালী এআই টুল আসতে চলেছে, আর তা হল Sora AI।

Sora AI (সোরা এআই) কী‌?

Sora AI (সোরা এআই) কী‌?

Sora AI হল একটি টেক্সট-টু-ভিডিও জেনারেটিভ AI মডেল, যা মূলত OpenAI দ্বারা তৈরি করা হয়েছে। ওপেনএআই হলো একটি আর্টিফিশিয়াল ইন্টেলিজেন্স নিয়ে কাজ করা প্রযুক্তি প্রতিষ্ঠান, যার এখনো পর্যন্ত বেশ কয়েকটি সার্ভিস উন্মুক্ত করা হয়েছে। এগুলোর মধ্যে অন্যতম হলো, ChatGPT ও DALL·E। যেখানে, এই প্ল্যাটফর্ম গুলোতে Text Prompts ব্যবহার করে বিভিন্ন সমস্যার সমাধান করা এবং ইমেজ তৈরি করে নেওয়া যায়।

OpenAI এর Sora AI ব্যবহার করার মাধ্যমে একজন ব্যবহারকারী Text Prompts দিয়ে একইভাবে ভিডিও তৈরি করে নিতে পারেন। এটি ব্যবহারকারীদেরকে সর্বোচ্চ এক মিনিট পর্যন্ত ভিডিও তৈরি করতে দেয়।

সোরা এআই ব্যবহারকারীদের বর্ণনার উপর ভিত্তি করে জটিল সব দৃশ্য, চরিত্র এবং নির্দিষ্ট স্থানের বিবরণসহ ভিডিও তৈরি করতে পারে। Sora AI একটি ইমেজ থেকে আইডিয়া নিয়ে ভিডিও তৈরি করতে পারে এবং সেই সাথে এটি এনিমেটেড কনটেন্ট ও তৈরি করতে সক্ষম।

যাইহোক, ওপেনএআই এর তৈরি এই Sora AI এখনো পর্যন্ত ডেভলপমেন্ট পর্যায়ে রয়েছে এবং এটি এখনো সবার জন্য উন্মুক্ত করে দেওয়া হয়নি। ‌বরং, এটি শুধুমাত্র নির্দিষ্ট কিছু পেশাদার লোকদেরকে এবং গবেষকদের পরীক্ষামূলক ভাবে ব্যবহার করার জন্য অনুমতি দেওয়া হয়েছে। তবে আশা করা যায় যে, খুব শীঘ্রই এটি হয়তোবা জনসাধারণের ব্যবহারের জন্য উন্মুক্ত করে দেওয়া হতে পারে।

OpenAI এর Sora AI কীভাবে কাজ করে?

OpenAI এর Sora AI কীভাবে কাজ করে?

সংক্ষেপে বলতে গেলে, Sora AI ঠিক একটি AI Image Generator এর মত কাজ করে, যা আপনারা ইতিমধ্যেই ব্যবহার করছেন। AI Image Generators গুলো Diffusion Models নামে পরিচিত একটি পদ্ধতি ব্যবহার করে। Sora AI কে কাজ করানোর জন্য প্রথমে বিভিন্ন ভিডিওতে প্রশিক্ষিত করা হয়েছে। ‌কোন একটি অবজেক্ট চেনার জন্য এটিকে ব্যাপক প্রশিক্ষণ দেওয়া হয়েছে এবং এরকম কোন বিষয়ে প্রশিক্ষিত করার জন্য সোরা এআই কে ভিডিওতে কী ঘটছে, তা Alt Text দিয়ে Explaining করা হয়।

সোরা এআই টেক্সট প্রম্পট থেকে ডিফিউশন মডেল এর মাধ্যমে স্থির ছবি তৈরি করে এবং তারপর ধীরে ধীরে ছবিগুলোকে ভিডিওতে রূপান্তর করে। গত বছর থেকে আমরা যেসব এআই ইমেজ দেখছি, তার চাইতে এটি অনেক বড় চ্যালেঞ্জ। ‌যেখানে এই মডেলটিকে প্রত্যেকটি ভিডিওর জন্য Movement, Reflections, Shadows এবং আরো অনেক দীর্ঘ তালিকা সম্পর্কে বুঝতে হবে।

যাইহোক, OpenAI তাদের এই বিষয়টিকে আরো স্বচ্ছতার অংশ হিসেবে, Sora AI মডেলটি কীভাবে কাজ করে, তার সম্পর্কে তাদের ওয়েবসাইটে বিস্তারিত বর্ণনা রয়েছে। আপনারা চাইলে সেটি দেখে নিতে পারেন। এবং এখানে Sora AI দ্বারা তৈরি করা অনেক ভিডিও রয়েছে।

Sora AI

অফিসিয়াল ওয়েবসাইট @ Sora AI

কীভাবে OpenAI এর তৈরি Sora AI ব্যবহার করবেন?

কীভাবে OpenAI এর তৈরি Sora AI ব্যবহার করবেন?

আপাতত, Sora AI সাধারণ মানুষের জন্য Available নয়। অতীতের মত ওপেনএআই তাদের এই টুল সব লোকদের জন্য এক্সেস করার অনুমতি দেয়নি। প্রথম ধাপে তারা শুধুমাত্র নির্দিষ্ট কিছু ব্যক্তি, প্রফেশনাল এবং গবেষকদের জন্য এক্সেস দিয়েছে, যারা 'রেড টিমার্স' নামে পরিচিত।

ওপেনএআই এই এআই টুলটির আরো ব্যাপক উন্নতির জন্য বা এই টুলটি ক্রিয়েটিভ লোকেরা কীভাবে ব্যবহার করে কাজ করবে, তার গবেষণার জন্য অল্প কিছু সংখ্যক Visual Artists, Designers এবং Filmmakers দেরকে অ্যাক্সেস দেওয়া হয়েছে। আর সম্ভবত সোরা এআই ও খুব শীঘ্রই জনসাধারণের জন্য Available হবে। কিন্তু, টেক্সট-টু-ভিডিও জেনারেটর এর শক্তিশালী টুল হিসেবে এটি তাদের পেইড সার্ভিসের অন্তর্ভুক্ত হতে পারে।

Sora AI কী সেরা এআই ভিডিও জেনারেটর?

Sora AI কী সেরা এআই ভিডিও জেনারেটর?

এখনো পর্যন্ত OpenAI তাদের Sora AI মডেল দ্বারা তৈরি করা এবং প্রকাশিত ভিডিওগুলো থেকে আমরা এমনটি ধারণা করছি যে, সোরা এআই অনেকে এগিয়ে রয়েছে। এখনো পর্যন্ত বিভিন্ন এআই দ্বারা তৈরি করা ভিডিও গুলো বিশ্লেষণ করলে দেখা যায় যে, Sora AI এর তৈরি করা ভিডিও অনেক বেশি উন্নত মানের।

বেশ কয়েক বছর আগে এআই দ্বারা তৈরি করা একটি টিভি ভিডিও বিজ্ঞাপণ ভাইরাল হয়েছিল। যে বিজ্ঞাপনটির ভিডিওর নাম ছিল ‘Pepporoni Hug Spot’, যা ব্যাপক হাস্যরস সৃষ্টি করে। কেননা, সেটি একেবারেই বিকৃত মানুষের ছবি ও অঙ্গভঙ্গি তৈরি করেছিল।

সে দিক থেকে দেখা যায় যে, এখনো পর্যন্ত Sora AI দিয়ে তৈরি করা ভিডিওগুলোতে সঠিক লাইটিং, রিফ্লেকশন এবং মানুষের চরিত্রগুলো রয়েছে। এটি আশ্চর্যজনকভাবে এমন সব কঠিন সমস্যার ভিডিও তৈরি করেছে, যেগুলো আসলে বাহিরের লোকের দ্বারা করা সম্ভব নয়।

যাইহোক, এর মানে এই নয় যে, এটি ভিডিও তৈরি করার ক্ষেত্রে একেবারে নিখুঁতভাবে কাজ করতে পারে। বর্তমানে আমরা শুধুমাত্র তাদের ওয়েবসাইটে বাছাই করা ভিডিও গুলোই দেখতে পাচ্ছি। যখন এটি জনসাধারণের জন্য উন্মুক্ত করে দেওয়া হবে, তখন আমরা এই মডেলটির দুর্বলতা এবং ত্রুটিপূর্ণ ভিডিও গুলো নিয়ে বিশ্লেষণ করতে পারব। তবে, OpenAI এর অন্যান্য সফল এআই প্রজেক্টগুলো থেকে এমনটি ধারণা করা যাচ্ছে যে, তাদের সোরা এআই টুলটি ও যথেষ্ট শক্তিশালী হবে।

শেষ কথা

২০২২ সালের শেষের দিকে ওপেনএআই তাদের এআই চ্যাটবট হিসেবে ChatGPT সামনে আনার পর অনেক বেশি জনপ্রিয়তা অর্জন করে। আর এরই ধারাবাহিকতায়, তাদের টেক্সট-টু-ইমেজ জেনারেটর সার্ভিস আসে, যেটিও Text Prompts থেকে অসাধারণ সব ইমেজ তৈরি করে দিতে সক্ষম।

আর, এআই বিশ্বে নতুন চমক হিসেবে Sora AI নামে নতুন আরো একটি টুল এসেছে, যা বর্তমানে ভিডিও তৈরির ধারণাকে সম্পূর্ণভাবে পাল্টে দিতে পারে। যদিও এখনো পর্যন্ত সোরা এআই জনসাধারণের ব্যবহারের জন্য উন্মুক্ত করে দেয়া হয়নি। ‌ তবে আশা করা যায়, খুব শীঘ্রই এটি সকলের ব্যবহারের জন্য অ্যাক্সেস দেওয়া হবে।

Level 15

আমি মো আতিকুর ইসলাম। কন্টেন্ট রাইটার, টেল টেক আইটি, গাইবান্ধা। বিশ্বের সর্ববৃহৎ বিজ্ঞান ও প্রযুক্তির সৌশল নেটওয়ার্ক - টেকটিউনস এ আমি 3 বছর 7 মাস যাবৎ যুক্ত আছি। টেকটিউনস আমি এ পর্যন্ত 364 টি টিউন ও 93 টি টিউমেন্ট করেছি। টেকটিউনসে আমার 61 ফলোয়ার আছে এবং আমি টেকটিউনসে 3 টিউনারকে ফলো করি।

“আল্লাহর ভয়ে তুমি যা কিছু ছেড়ে দিবে, আল্লাহ্ তোমাকে তার চেয়ে উত্তম কিছু অবশ্যই দান করবেন।” —হযরত মোহাম্মদ (সঃ)


টিউনস


আরও টিউনস


টিউনারের আরও টিউনস


টিউমেন্টস