
রোবোটিক্স এর জগতে যে অগ্রগতি হচ্ছে তা সত্যিই ইনসেইন (Insane) এবং প্রতিনিয়ত আমাদের অবাক করছে। হিউম্যানয়েড রোবট এর ক্ষমতা এখন শুধু সায়েন্স ফিকশন এর পাতায় সীমাবদ্ধ নেই, বরং বাস্তব জীবনেও আমরা তাদের ইনক্রেডিবল কাজ দেখতে পাচ্ছি।
Boston Dynamics তাদের রোবট Atlas এর একটি নিউ ডেমো ভিডিও প্রকাশ করেছে, যা তাদের নেক্সট জেনারেশন এর রোবট এর ক্ষমতা প্রদর্শন করে। ভিডিও টি দেখলে আপনি মুগ্ধ হবেন - দেখুন Atlas কতটা স্মুথ এবং ফ্লুইড মোশন এ কাজ করছে! এর চলাফেরা, অবজেক্ট ম্যানিপুলেট করার ভঙ্গিমা দেখে মনে হয় যেন একজন দক্ষ মানুষ কাজ করছে। এটি সম্পূর্ণ অটোনোমাস এবং ভিডিও টি 1x স্পিড এ ধারণ করা হয়েছে, যা এর রিয়েল-টাইম কেপাবিলিটি এর প্রমাণ এবং কোনো এডিটিং ট্রিক এর ইঙ্গিত নয়।
ভিডিও তে দেখা যায়, Atlas একটি বক্স খুলছে এবং এর ভেতরের জিনিস (যেমন একটি মেটাল ব্লক) বের করে পাশের বিন এ রাখছে। কিন্তু সবচেয়ে ইন্টারেস্টিং পার্ট হলো, যখন একজন মানুষ একটি হকি স্টিক দিয়ে বক্স টি সরিয়ে দিয়ে এটিকে মেস করার চেষ্টা করে, তখন Atlas থেমে না গিয়ে স্মার্টলি অ্যাডাপ্ট করে। এটি বক্স টি আবার গ্র্যাব করে, নিজের কাছে মুভ করে এবং তার টাস্ক চালিয়ে যায়! এই পরিস্থিতিতে রিয়েল-টাইম প্রবলেম-সলভিং, অবস্ট্যাকল অ্যাভয়েডেন্স এবং অ্যাডাপ্টেবিলিটি এর ক্ষমতা Atlas কে সত্যিই অসাধারণ করে তুলেছে, যা তাকে ডাইনামিক এবং আনপ্রেডিক্টেবল এনভায়রনমেন্ট এ কাজ করার জন্য উপযুক্ত করে তোলে।
আর একটি কুল বিষয় হলো, ভিডিও তে ভার্চুয়াল এনভায়রনমেন্ট (Virtual Environment) এর একটি ভিজ্যুয়ালাইজেশন (Visualization) ও দেখা যায়। রোবট টি একই সাথে এই ভার্চুয়াল এনভায়রনমেন্ট এ ভিজ্যুয়ালাইজ এবং রান করতে সক্ষম, এবং সম্ভবত এখান থেকেই এটি ট্রেন করে, রিয়েল-ওয়ার্ল্ড ডেটা এর পাশাপাশি সিমুলেটেড ডেটা ব্যবহার করে। আপনি দেখতে পাবেন রোবট আর্ম টি তার পরবর্তী পদক্ষেপ কোথায় হবে তা আগে থেকেই ভিজ্যুয়ালাইজ করছে, যা তার প্ল্যানিং এবং প্রেডিক্টিভ কেপাবিলিটি এর ইঙ্গিত দেয়।

পরে Demo তে Spot Robot (তাদের বিখ্যাত Dog Base Robot) এর Parts গুলোকে Atlas Gently Pick Up করছে, Multiple Ways এ Grab করছে, Two Arms ব্যবহার করে Fold করছে এবং সেগুলো Put Away করার চেষ্টা করছে। এটি দেখায় যে Atlas শুধুমাত্র Generic Tasks ই নয়, বরং Complex এবং Delicates Objects এর সাথেও কাজ করতে সক্ষম। যদিও এটি এখনো কিছুটা Faster এবং Fluid হতে হবে, তবে এই Progress Incredible! গত কয়েক বছরে Humanoid Robots এর অগ্রগতি একেবারেই Insane ছিল, যা Automation এবং Human-Robot Collaboration এর ভবিষ্যৎকে নতুনভাবে সংজ্ঞায়িত করছে।

কেন Atlas এর এই Demo এত Impressive? Twitter এর Humanoid Hub এটিকে এভাবে Break Down করেছে: তাদের Approach Long Horizon Language Conditioned Manipulation এর উপর Focus করে। অর্থাৎ, আপনি Robot কে যে Complex Task টি করতে চান তা স্বাভাবিক ভাষা (Language) ব্যবহার করে বলেন (যেমন, "এই জিনিসগুলো এই Box থেকে ওই Bin এ রাখো"), এবং Robot টি সেই Long Horizon Task টি (একটি Sequenced, Multi-Step Task) সফলভাবে সম্পন্ন করে। "Language Conditioned Manipulation and Locomotion by Mapping Sensor Inputs and Language Prompts into Whole Body Control at High Frequency" - এই টেকনিক্যাল বর্ণনাটি যদিও একটি Mouthful, এর সহজ অর্থ হলো: আপনি Robot কে কিছু বলেন এবং এটি সেই নির্দেশ অনুযায়ী তার সম্পূর্ণ Body Control (Locomotion এবং Manipulation উভয়ই) ব্যবহার করে দ্রুত এবং নির্ভুলভাবে কাজ করে।
এই ধরনের অ্যাডভান্সড রোবট গুলোকে কীভাবে ট্রেন করা হয়? অ্যাকচুয়াল ট্রেনিং প্রসেস টি দেখতে এইরকম: টেলিঅপারেটেড ডেটা কালেকশন। এর মানে হলো, একজন হিউম্যান অপারেটর কন্ট্রোল এর পিছনে বসে ম্যানুয়ালি রোবট কে টাস্ক টি করতে গেটস এবং রোবট টি সেই হিউম্যান ডেমনস্ট্রেশন গুলো থেকে লার্ন করে। তারপর সেই ডেটা গুলো পাইপলাইন এ কিউরেশন (নির্বাচন এবং প্রস্তুতকরণ) করা হয়, লার্জ-স্কেল মডেল ট্রেনিং চালানো হয় এবং রিগোরাস ইভ্যালুয়েশন (Rigorous Evaluation) এর মাধ্যমে ইমপ্রুভমেন্ট গাইড করা হয়। যদি আপনি Atlas এর এই ব্রেকথ্রু সম্পর্কে আরও ডিটেল জানতে চান, তবে তাদের এই ব্লগ Post টি চেক আউট করতে পারেন।
-
টেকটিউনস টেকবুম
আমি টেকটিউনস টেকবুম। বিশ্বের সর্ববৃহৎ বিজ্ঞান ও প্রযুক্তির সৌশল নেটওয়ার্ক - টেকটিউনস এ আমি 12 বছর 4 মাস যাবৎ যুক্ত আছি। টেকটিউনস আমি এ পর্যন্ত 1069 টি টিউন ও 0 টি টিউমেন্ট করেছি। টেকটিউনসে আমার 3 ফলোয়ার আছে এবং আমি টেকটিউনসে 0 টিউনারকে ফলো করি।