Homeবিজ্ঞান ও প্রযুক্তিহিউম্যানয়েড রোবট ও সূক্ষ্ম কাজ

হিউম্যানয়েড রোবট ও সূক্ষ্ম কাজ

ইন্টারনেট খুললেই এখন প্রায়শই দেখা যায় মানুষের মতো দেখতে রোবট বা ‘হিউম্যানয়েড‘ অনায়াসে দৌড়াচ্ছে, লাফ দিচ্ছে, এমনকি শূন্যে ব্যাকফ্লিপ বা ডিগবাজিও খাচ্ছে। বোস্টন ডায়নামিক্সের (Boston Dynamics) অ্যাটলাস রোবটের জিমন্যাস্টিকস দেখে মনে হতেই পারে, রোবটরা বুঝি আমাদের শারীরিক সক্ষমতার সবকিছুই জয় করে ফেলল! কিন্তু এই একই অত্যাধুনিক রোবটকে যদি বলা হয় একটি শার্টের বোতাম লাগিয়ে দিতে, সুঁচে সুতো পরাতে কিংবা জট পাকিয়ে থাকা তারের গুচ্ছ ছাড়াতে—তখনই বাঁধে বিপত্তি। কোটি টাকার এই যন্ত্রগুলো তখন এমন অসহায় আচরণ করে যা দেখলে রীতিমতো অবাক হতে হয়।

কোয়ান্টা ম্যাগাজিনের সাম্প্রতিক এক দীর্ঘ প্রতিবেদনে ঠিক এই বিষয়টি নিয়েই গভীর আলোচনা করা হয়েছে। কেন কোটি কোটি টাকার এই অত্যাধুনিক রোবটগুলো এখনও মানুষের দৈনন্দিন ছোটখাটো বা সূক্ষ্ম কাজগুলোতে (Fine motor skills) রীতিমতো হিমশিম খায়?

মোরাভেকের প্যারাডক্স: কঠিন কাজ সহজ, সহজ কাজ কঠিন

আশির দশকে কৃত্রিম বুদ্ধিমত্তা গবেষক হ্যান্স মোরাভেক একটি চমৎকার পর্যবেক্ষণ তুলে ধরেছিলেন। তার মতে, এআই বা রোবটের কাছে মানুষের মতো দাবা খেলা বা জটিল গাণিতিক হিসাব করা খুব সহজ, কিন্তু এক বছরের একটি শিশুর মতো হাঁটা, দেখা বা স্পর্শ করে কোনো কিছু বোঝার ক্ষমতা অর্জন করা তাদের কাছে সবচেয়ে কঠিন। একেই বলা হয় ‘মোরাভেকের প্যারাডক্স’।

রোবটের দৌড়ানো বা ভারী জিনিস তোলার জন্য শুধু নির্দিষ্ট কিছু গাণিতিক হিসাব এবং শক্তিশালী মোটরের প্রয়োজন হয়। কিন্তু একটি চশমার কাঁচ মোছা বা একটি ডিম ধরার মতো কাজগুলো সম্পূর্ণ আলাদা এবং বৈজ্ঞানিক দৃষ্টিকোণ থেকে অনেক বেশি জটিল।

রোবট বনাম মানুষের হাত: হার্ডওয়্যারের লড়াই

মানুষের হাতের গঠন প্রকৃতির এক বিস্ময়কর সৃষ্টি। আমাদের হাতের তালু ও আঙুলে রয়েছে জটিল পেশি, লিগামেন্ট এবং টেন্ডনের এক অপূর্ব সমন্বয়। আমাদের হাত প্রাকৃতিকভাবেই ‘কমপ্লায়েন্ট’ (Compliant) বা নমনীয়। অর্থাৎ, শক্ত কোনো কিছুর সাথে ধাক্কা লাগলে আমাদের হাত নিজে থেকেই একটু পিছিয়ে আসে বা মানিয়ে নেয়।

অন্যদিকে, রোবটের হাত তৈরি শক্ত ধাতু, প্লাস্টিক আর গিয়ার দিয়ে। এগুলো চলে মোটর বা অ্যাকচুয়েটরের সাহায্যে। রোবট যখন কোনো কিছু ধরতে যায়, তখন তার শক্ত আঙুলগুলো ঠিক মানুষের মতো মানিয়ে নিতে পারে না। সামান্য একটু হিসাবের ভুল হলেই রোবট হয়তো কাঁচের গ্লাস ভেঙে ফেলে, নয়তো এত হালকা করে ধরে যে গ্লাসটি হাত ফসকে পড়ে যায়।

দৃষ্টিশক্তির বাধা এবং স্পর্শের অভাব

রোবট মূলত কাজ করে তার মাথায় লাগানো ক্যামেরার সাহায্যে দেখে। কিন্তু যখনই রোবট তার হাত বাড়িয়ে কোনো বস্তু ধরতে যায়, তখন তার নিজের হাতই ক্যামেরার দৃষ্টি আটকে দেয়। বিজ্ঞানের ভাষায় একে বলে ‘অক্লুশন’ (Occlusion)। আপনি নিজে একবার চোখ বন্ধ করে পকেট থেকে চাবি বের করার কথা ভাবুন। আপনি চোখ দিয়ে না দেখলেও শুধু আঙুলের স্পর্শ দিয়ে ঠিকই চাবি চিনে নিতে পারেন।

কারণ, আমাদের ত্বকে রয়েছে লাখ লাখ স্নায়ুকোষ বা ট্যাকটাইল সেন্সর, যা মস্তিষ্ককে চাপ, তাপমাত্রা এবং ঘর্ষণের নিখুঁত তথ্য দেয়। রোবটের ক্ষেত্রে এই ‘স্পর্শের অনুভূতি’ তৈরি করাটাই সবচেয়ে বড় চ্যালেঞ্জ। রোবটের আঙুলে কৃত্রিম সেন্সর লাগাতে গেলে প্রচুর তারের প্রয়োজন হয়, যা আঙুল বাঁকা করার সময় সহজেই ছিঁড়ে যায়। এই সমস্যা সমাধানে বিজ্ঞানীরা এখন ‘জেলসাইট’ (GelSight) এর মতো সেন্সর ব্যবহার করছেন। এখানে রোবটের আঙুলের ডগায় একটি নরম জেলের প্যাড থাকে এবং তার ভেতরে একটি ক্ষুদ্র ক্যামেরা থাকে। রোবট কিছু স্পর্শ করলে জেলের আকার কীভাবে বদলাচ্ছে, ক্যামেরা তা দেখে স্পর্শের অনুভূতি বোঝার চেষ্টা করে।

সিমুলেশনের সমস্যা: ‘সিম-টু-রিয়েল’ গ্যাপ

বিজ্ঞানীরা রোবটকে কাজ শেখানোর জন্য প্রথমে কম্পিউটারের ভেতরে একটি ভার্চুয়াল জগৎ বা ‘সিমুলেশন‘ তৈরি করেন। সেখানে রোবট আর্টিফিশিয়াল ইন্টেলিজেন্সের (Reinforcement Learning) মাধ্যমে লাখ লাখ বার চেষ্টা করে কাজ শেখে।

কিন্তু মূল সমস্যা হলো, কম্পিউটারের ভেতরের জগৎ আর বাস্তব জগৎ এক নয়। সিমুলেশনে মাধ্যাকর্ষণ বা বাতাসের বাধা নিখুঁতভাবে তৈরি করা গেলেও, দুটি বস্তুর ঘর্ষণ বা ‘কন্ট্যাক্ট ডাইনামিক্স’ (Contact dynamics) হুবহু নকল করা প্রায় অসম্ভব। একটি শক্ত কিউব ধরা রোবটের জন্য সহজ, কিন্তু একটি নরম তোয়ালে ভাঁজ করা বা একটি চার্জারের তার পেঁচানো অত্যন্ত কঠিন। কারণ নরম বস্তু প্রতিটি স্পর্শে তার আকার বদলায়, যা সিমুলেশনে আগে থেকে হিসাব করা যায় না। এর ফলে কম্পিউটারে নিখুঁত কাজ করা রোবট বাস্তবে এসে বোকা বনে যায়। একেই বলা হয় ‘সিম-টু-রিয়েল গ্যাপ’ (Sim-to-Real Gap)।

মানুষের কাছ থেকে শেখা: টেলি-অপারেশন

সিমুলেশনের সীমাবদ্ধতা কাটাতে বিজ্ঞানীরা এখন নতুন পথে হাঁটছেন। তারা ভিআর (VR) হেডসেট ও বিশেষ গ্লাভস পরে রোবটকে রিমোট কন্ট্রোলের মতো পরিচালনা করছেন। একজন মানুষ তার নিজের বুদ্ধি খাটিয়ে রোবটের হাত দিয়ে একটি ডিম তুলছেন বা কফি বানাচ্ছেন। রোবট তখন তার ক্যামেরা ও সেন্সর দিয়ে রেকর্ড করে রাখছে মানুষটি ঠিক কীভাবে, কতটুকু চাপ দিয়ে কাজটা করল।

এভাবে হাজার হাজার ঘণ্টার ডেটা সংগ্রহ করে রোবটকে শেখানো হচ্ছে, যাকে বলা হয় ‘ইমিটেশন লার্নিং‘ (Imitation Learning) বা অনুকরণ করে শেখা।

ভবিষ্যতের পথ: এন্ড-টু-এন্ড লার্নিং

আগে রোবটকে একটি কাজ করতে হলে অনেকগুলো ধাপে নির্দেশ দিতে হতো (যেমন: বস্তু চিহ্নিত করো -> দূরত্ব মাপো -> হাত বাড়াও -> চাপ দাও)। কিন্তু এখন ‘এন্ড-টু-এন্ড লার্নিং’ (End-to-End Learning) নামের অত্যাধুনিক এআই মডেল ব্যবহার করা হচ্ছে। চ্যাটজিপিটি যেমন কোটি কোটি শব্দ পড়ে মানুষের মতো কথা বলতে শিখেছে, ঠিক তেমনি রোবট সরাসরি ক্যামেরার ছবি (পিক্সেল) ইনপুট হিসেবে নিয়ে মস্তিষ্কে প্রসেস করে সরাসরি মোটরে (অ্যাকশনে) নির্দেশ পাঠাচ্ছে।

হিউম্যানয়েড রোবট হয়তো খুব শিগগিরই কারখানায় ভারী বাক্স ওঠানো-নামানোর কাজ পুরোপুরি নিজেদের দখলে নিয়ে নেবে। ব্যাকফ্লিপ দেওয়া বা দৌড়ানোর মতো কঠিন ফিজিক্স তারা জয় করে ফেলেছে। কিন্তু আপনার ঘরের চশমার কাঁচ সাবধানে মুছে দেওয়া, বইয়ের পাতা উল্টানো বা জুতার ফিতা বেঁধে দেওয়ার মতো সূক্ষ্ম কাজের জন্য তাদের ওপর ভরসা করতে আমাদের আরও বেশ কিছুটা সময় অপেক্ষা করতে হবে। মানুষের হাত যে প্রকৃতির কত বড় এক বিস্ময়, তা এই রোবটগুলো তৈরি করতে গিয়ে বিজ্ঞানীরা হাড়ে হাড়ে টের পাচ্ছেন।

Raisul Sohan
Raisul Sohan
বিজ্ঞান অনুরাগী। শখের বিজ্ঞান লেখক।
RELATED ARTICLES

Most Popular