گروه روباتیک در بخش DeepMind گوگل از سه محصول جدید رونمایی کرده است که به ربات ها کمک می کند تا تصمیمات سریع تری بگیرند و در حین انجام وظایف اطراف افراد، کارآمدتر و ایمن تر عمل کنند.
سیستم جمعآوری دادههای AutoRT مبتنی بر مدل زبان بصری (VLM) و مدل زبان بزرگ (LLM) است - آنها به رباتها کمک میکنند تا محیط را ارزیابی کنند، با موقعیتهای ناآشنا سازگار شوند و در مورد انجام وظایف تصمیم بگیرند. VLM برای تجزیه و تحلیل محیط و تشخیص اشیاء در محدوده دید استفاده می شود، در حالی که LLM مسئول اجرای خلاقانه وظایف است. مهمترین نوآوری AutoRT ظاهر شدن در بلوک LLM "Robot Constitutions" بود - دستورات ایمنی محور که به ماشین می گویند از انتخاب کارهایی که شامل افراد، حیوانات، اشیاء تیز و حتی لوازم الکتریکی می شود اجتناب کند. به منظور ایمنی بیشتر، کار به گونه ای برنامه ریزی شده است که زمانی که نیروی وارده بر مفاصل از حد معینی فراتر رفت، متوقف شود. و طراحی آنها اکنون دارای یک سوئیچ فیزیکی اضافی است که فرد می تواند در مواقع اضطراری از آن استفاده کند.
طی هفت ماه گذشته، گوگل 53 شغل را با سیستم AutoRT در چهار ساختمان اداری خود مستقر کرده و بیش از 77 آزمایش انجام داده است. برخی از ماشین ها از راه دور توسط اپراتورها کنترل می شدند، در حالی که برخی دیگر وظایف را به طور مستقل یا بر اساس یک الگوریتم مشخص یا با استفاده از مدل هوش مصنوعی ترانسفورماتور رباتیک (RT-2) انجام می دادند. تاکنون، همه این رباتها ظاهری بسیار ساده دارند: آنها اندام دستکاری روی یک پایه متحرک و دوربینهایی برای ارزیابی وضعیت هستند.
دومین نوآوری سیستم SARA-RT (توجه قوی خود تطبیقی برای ترانسفورماتورهای رباتیک) بود که هدف آن بهینه سازی عملکرد مدل RT-2 بود. محققان دریافتند که با دو برابر کردن داده های ورودی، به عنوان مثال، افزایش وضوح دوربین ها، نیاز ربات به منابع محاسباتی چهار برابر افزایش می یابد. این مشکل با یک روش جدید تنظیم دقیق هوش مصنوعی به نام up-training حل شد - این روش رشد درجه دوم نیاز به منابع محاسباتی را به یک تقریباً خطی تبدیل می کند. به همین دلیل، این مدل با حفظ کیفیت قبلی، سریعتر کار می کند.
سرانجام، مهندسان Google DeepMind مدل RT-Trajectory AI را توسعه دادند که آموزش رباتها را برای انجام وظایف خاص ساده میکند. پس از تنظیم یک کار، خود اپراتور نمونه ای از اجرای آن را نشان می دهد، RT-Trajectory مسیر حرکت تعیین شده توسط یک فرد را تجزیه و تحلیل می کند و آن را با اقدامات ربات تطبیق می دهد.
همچنین بخوانید: