
বন্ধুরা, Tech World এখন এক চরম উত্তেজনার কেন্দ্রে! চারদিকে কানাঘুষো চলছে যে Google Gemini এর Next Generation Launch এর জন্য পুরোপুরি প্রস্তুত। বাজারে ফিসফাস, একটি New Leak ইঙ্গিত দিচ্ছে যে এই বহুল প্রতীক্ষিত AI Model টি সম্ভবত আগামী Week এই আমাদের সামনে চলে আসছে—'তৃতীয়বারই ম্যাজিক' এই প্রবাদটি কি তাহলে Google এর জন্য সত্যি হতে চলেছে?
X নামে পরিচিত Platform এ @chatgpt21 এর Share করা একটি Screenshot অনুসারে, Gemini 3.0 এর আনুষ্ঠানিক Launch Date October 22 নির্ধারণ করা হয়েছে। যদিও Google বা অন্য কোনো নির্ভরযোগ্য Source থেকে আমরা এই Information টি Verify করতে পারিনি, এই Rumor টি কিন্তু Google এর AI এর Future কী হতে পারে, তা নিয়ে Ideas এবং গভীর Analysis এর জন্ম দিয়েছে।
আমরা AI এর জগতে Gemini এর উত্থান দেখেছি। Gemini 1.5 এসে Benchmark এবং Multimodality তে সবাইকে Surprise করেছিল। এরপর Gemini 2.0 কিছুটা Reset এর মতো Feel হলেও, Gemini 2.5 অবশেষে দেখিয়েছে Google এর এই AI আসলে কতটা Powerful। Paper এ, অর্থাৎ Laboratory Benchmarks এবং Technical Performance এর দিক থেকে এটি নিঃসন্দেহে Chat GPT এর সাথে জোর Compete করার মতো শক্তিশালী। কিন্তু আমাদের Daily Life এর Real Life Usage এর Experience সম্পূর্ণ ভিন্ন। বেশিরভাগ People এখনও Chatbot বলতে প্রথমেই Chat GPT খোলে, আর AI শব্দটি শুনলেই প্রথম Thing হিসেবে তাদের Mind এ Chat GPT কেই আসে।
Gemini 3 হলো সেই Golden Chance যা Google কে এই Dominance Change করার Opportunity দেবে। Chat GPT কে কেবল টেক্কা দিতে হলে এটিকে শুধু Smarter হলেই চলবে না; এটিকে Users দের Every Single Day এর Interaction এ আরও Better Experience প্রদান করতে হবে। তাহলে চলুন, সেই পাঁচটি Things আলোচনা করা যাক, যা Gemini 3 কে অবশ্যই Improve করতে হবে যদি এটি World এর Number One AI Chatbot হিসাবে Chat GPT কে Pass করতে চায়।

আমাদের Chatbot এর সাথে Conversations গুলো এখন আর ছোটখাটো Transaction নয়। আমরা এটিকে নিয়ে Long Projects করি, Giant Conversations তৈরি করি, এমনকি Long Documents Handle করাই। কিন্তু Gemini 2.5 এর একটি বড় Problem হলো—এটি প্রায়শই Track Lose করে ফেলে, অর্থাৎ ভুলে যায় আপনি কী নিয়ে কথা বলছেন।
আপনি হয়তো একটি Project নিয়ে Chat শুরু করলেন, কিছুটা এগিয়ে গেলেন, এরপর অন্য প্রসঙ্গে গিয়ে আবার আগের Thread এ ফিরে এলেন। সেখানেই বাধে বিপত্তি! আমি প্রায়শই দেখি, Chat এর শুরুর দিকের কোনো Key Details বা Reference টেনে আনলে, Gemini এমন Act করে যেন এটি সেই Thing সম্পর্কে আগে কখনও শোনেনি।
যদিও এই Short-Term Memory Loss সবার জন্য চরম Dealbreaker নয়, তবুও একটি AI Chatbot এর User Experience এর জন্য Memory হলো Most Important Features এর মধ্যে অন্যতম। এবং এই Department এ Gemini এখনও Lacking। Chat GPT পুরোপুরি Perfect না হলেও, এটি অন্তত Context ধরে রাখতে বেশি Consistent এবং এর Memory তুলনামূলকভাবে বেশি Reliable।
Gemini 3 কে এমন Memory তৈরি করতে হবে যা সত্যিই Human এর মতো Feel হয়—কেবল বর্তমান Session এর জন্য নয়, এটি যেন পূর্বের Session বা Conversations থেকে Key Details Remember করতে পারে, Ongoing Tasks Understand করতে পারে, এবং ব্যবহারকারীকে একই Information বারবার Repeat করতে Force না করেই Previous Messages এর ওপর Build করতে পারে। Google যদি এই Challenge টি মোকাবিলা করতে পারে, তবে Gemini অবশেষে Short-Term Memory Loss যুক্ত একজন Helpful Stranger এর চেয়ে একজন Proper Assistant এর Role নিতে পারবে।

আপনি যখন Chatbot এর সাথে জটিল Analysis বা দীর্ঘ Conversations করছেন, তখন Response Speed এর Importance হয়তো অনেকে বুঝতে পারে না। ধীর গতির Response পুরো Workflow কেই নষ্ট করে দেয়।
Gemini 2.5 Flash এর একটি Feature হলো 'Thinking Mode'। এই Mode এ AI উত্তর দেওয়ার আগে তার Reasoning Show করে। এই Feature টি Intelligence এর দিক থেকে খুবই Impressive কারণ আমরা তার চিন্তাধারা দেখতে পাই, কিন্তু ব্যবহারকারী হিসেবে আমাদের জন্য অপেক্ষা করাটা Painfully Slow হতে পারে।
এখানে Open AI একটি স্মার্ট Approach নিয়েছে। Chat GPT 5 এখন যথেষ্ট Capable যে এটি আপনার দেওয়া Prompt এর Complexity Analyse করে নিজে থেকেই Decide করে নিতে পারে যে Answer তৈরি করার জন্য তার কতটা Time নিয়ে Think করা দরকার। এর ফলে এটি প্রয়োজন অনুযায়ী Speed এবং Intelligence এর মধ্যে একটি চমৎকার Balance তৈরি করতে পারে।
যদি Gemini 3 এই Ability Match করতে পারে—অর্থাৎ, আপনার প্রতিটি Prompt এর Complexity বুঝে Dynamically Decide করতে পারে যে Best Answer দেওয়ার জন্য তার how Complex AI Model ব্যবহার করা উচিত—যেমন ধরুন, একটি দ্রুত Flash Model নাকি একটি ভারী Ultra Model—তবে Gemini একই সাথে আরও Responsive এবং Personal Feel হবে। সবচেয়ে ভালো হয় যদি Google এই Decision নেওয়ার কিছুটা Control Users দের হাতেও দেয়।

আমি বারবার বলছি, আমার উদ্দেশ্য Chat GPT কে Gemini এর চেয়ে Better প্রমাণ করা নয়। Fact হলো, আমি অনেক Tasks এর জন্য Open AI's এর চেয়ে Google's AI Chatbot কেই বেছে নিই। তবে Reality হলো, Anthropic's Claude সহ সব AI Experiences এই একটি Area তে Improve করতে পারে। সেটি হলো Better Understanding; আমরা যাকে 'More Human-Like Understanding' বলতে পারি।
আমরা অনেক Moments দেখেছি যখন Users Gemini কে একটি স্বাভাবিক Question করেন, কিন্তু এটি সম্পূর্ণ ভিন্ন কিছু Returns করে। Problem এটা নয় যে Gemini এর Intelligence কম; Problem হলো এটি Question এর Intent Read করার সময় Wrong Interpretation Guess করে নেয় এবং সেই ভুল Assumption নিয়ে অত্যন্ত Confidently Runs করে।
Gemini 3 কে অবশ্যই Intent Read করার Ability তে Better হতে হবে। যদি কোনো Question এর Multiple Things Mean করার Scope থাকে (অর্থাৎ এটি Ambiguous হয়), তবে আন্দাজে Guess করে একটি ভুল Answer দেওয়ার চেয়ে এটিকে দ্রুত একটি Quick Follow-Up Ask করা উচিত—যেমন, "আপনি কি ভ্রমণের জন্য ফোনটি খুঁজছেন নাকি Professional Photography এর জন্য?" Google যদি Gemini 3 দিয়ে এই Nuance টি ক্যাপচার করতে পারে, তবে তারা AI জগতে অন্যদের জন্য একটি নতুন এবং উচ্চতর Mark Set করবে।

Gemini এখন Multimodal—এটি আপনার Photos এবং Short Videos Analyse করতে পারে। কিন্তু Current Level এর Understanding কেবল Surface-Level বা Shallow। এটি শুধু Objects বা Actions গুলোকে Identify করে।
আমাদের দরকার এর চেয়েও বেশি কিছু: এটি Real Analysis Offer করবে যা এটি Sees। উদাহরণ হিসেবে ভাবুন (imagine): আপনি Gym এ Workout করছেন, আর Gemini আপনার Body's Form এবং Technique এর Analysis Getting করে আপনাকে Real-Time Corrective Feedback দিচ্ছে। অথবা আপনি রান্না করছেন, আর এটি আপনাকে True Sous-Chef Capabilities দিচ্ছে—আপনার ফ্রিজের ছবি দেখে রেসিপি তৈরি করে দিচ্ছে বা Ingredient এর Nutritional Guidance দিচ্ছে। Google এর Fingertips এ রয়েছে World এর Vast Data (যেমন Google Search, Google Maps, Google Photos); এখন Time এসেছে Company এই Data Harness করে AI কিভাবে আমাদের Life Improve করার Way কে Truly Transform করতে পারে তা দেখানোর।

Google সবসময় Gemini কে একজন True Assistant হিসাবে পরিচয় করায়। কিন্তু Reality হলো, এটি এখনও একজন Very Smart Search Box বা Knowledge Engine এর চেয়ে বেশি Feel হয় না। এই Criticism টি অবশ্য AI Market এর Any Chatbot এর ক্ষেত্রেই প্রযোজ্য।
Gemini Information Find করতে পারে এবং সেগুলোকে Explain করতে পারে। কিন্তু যখন আপনি এটিকে Actually Real World এ কিছু কাজ করতে Ask করেন, তখন এটি একটি Wall Hit করে। উদাহরণস্বরূপ: আপনি রেস্তোরাঁর Information জানতে চাইলে এটি কেবল একটি Restaurant Show করবে, কিন্তু Booking করে দিতে পারবে না; এটি হয়তো একটি Email Draft করবে, কিন্তু আপনার অনুমতি নিয়ে Sending এর Action নেবে না। এমনকি যদি একটি Complex Multi-Step Tasks এর একটি Step Wrong যায়, তবে এটি Problem Solve করার জন্য Adapting না করে সহজে Gives up করে দেয় এবং আপনাকে হতাশ করে Starting from Scratch থেকে শুরু করতে বলে।
Gemini 3 কে অবশ্যই একটি Chatbot এর চেয়ে একজন Personal Assistant এর মতো Behave করা প্রয়োজন। এর মানে হলো Autonomous হওয়া—জটিল Multi-Step Tasks Completing করা, Users এর কাছ থেকে আসা on The Fly Changes Handling করা এবং Starting from Scratch শুরু না করে নিজের Mistakes Fixing করা। যদি Gemini 3 আপনার জন্য একটি সম্পূর্ণ Trip Plan করতে পারে (ফ্লাইট, হোটেল, Itinerary), আপনার Day Organize করতে পারে, বা Beginning থেকে End পর্যন্ত একটি Project Manage করতে পারে, তবেই People এটিকে Just Another AI Model এর চেয়েও বেশি হিসাবে See করবে এবং Google তার Assistant Vision এ সফল হবে।
Gemini 3 আসছে—এই Excitement এখন তুঙ্গে। আমরা Hope করি, Google তার Sleeve এর উপরে সত্যিই এমন কিছু AI Magic রেখেছে যা Gemini কে AI World এর Top Spot এ বসাতে সাহায্য করবে।
-
টেকটিউনস টেকবুম
আমি টেকটিউনস টেকবুম। বিশ্বের সর্ববৃহৎ বিজ্ঞান ও প্রযুক্তির সৌশল নেটওয়ার্ক - টেকটিউনস এ আমি 12 বছর 4 মাস যাবৎ যুক্ত আছি। টেকটিউনস আমি এ পর্যন্ত 1061 টি টিউন ও 0 টি টিউমেন্ট করেছি। টেকটিউনসে আমার 3 ফলোয়ার আছে এবং আমি টেকটিউনসে 0 টিউনারকে ফলো করি।