محققین Apple یک سیستم هوش مصنوعی به نام ReALM (رزولوشن مرجع به عنوان مدلسازی زبان) توسعه دادهاند که هدف آن بهبود اساسی نحوه درک دستیاران صوتی و پاسخ به دستورات است.
در یک مقاله تحقیقاتی Apple چارچوب جدیدی را برای چگونگی رسیدگی مدلهای زبان بزرگ به مشکل وضوح مرجع، که شامل رمزگشایی ارجاعات مبهم به اشیاء روی صفحه، و همچنین درک زمینه محاورهای و پسزمینه است، توصیف میکند. در نتیجه، ReALM می تواند به تعامل شهودی و طبیعی تر با دستگاه ها منجر شود.
تشخیص ارجاع بخش مهمی از درک زبان طبیعی است که به کاربران اجازه میدهد بدون سردرگمی از ضمایر و سایر مراجع غیرمستقیم در مکالمه استفاده کنند. برای دستیارهای دیجیتال، این توانایی از لحاظ تاریخی یک چالش مهم بوده است که به دلیل نیاز به تفسیر طیف گسترده ای از سیگنال های کلامی و اطلاعات بصری محدود شده است. سیستم ReALM از Apple هدف این است که این مشکل را با تبدیل فرآیند پیچیده تشخیص مرجع به یک کار مدل سازی زبان خالص حل کند. به این ترتیب، او می تواند ارجاعات به عناصر بصری نمایش داده شده بر روی صفحه را درک کند و این درک را در جریان گفتگو ادغام کند.
ReALM ساختار بصری صفحه را با استفاده از نمایش های متنی بازسازی می کند. این شامل تجزیه اشیاء صفحه و مرتب کردن آنها برای ایجاد قالب متنی است که محتوا و ساختار صفحه را منعکس می کند. محققین Apple دریافتند که این استراتژی، همراه با تنظیم ویژه مدلهای زبان برای مشکلات حل معیار، به طور قابلتوجهی از روشهای سنتی، از جمله قابلیتهای GPT-4 OpenAI بهتر عمل میکند.
ReALM میتواند کاربران را قادر سازد تا بر اساس آنچه که در حال حاضر روی صفحه نمایش داده میشود، بدون نیاز به دستورالعملهای دقیق و دقیق با دستیارهای دیجیتال تعامل مؤثرتری داشته باشند. این میتواند دستیارهای صوتی را در موقعیتهای مختلف بسیار مفیدتر کند، مانند کمک به رانندگان در جهتیابی سیستمهای اطلاعات سرگرمی در حین رانندگی یا کمک به کاربران دارای معلولیت با ارائه ابزارهای آسانتر و دقیقتر برای تعامل غیرمستقیم.
Apple تاکنون چندین مقاله تحقیقاتی در زمینه هوش مصنوعی منتشر کرده است. ماه گذشته، این شرکت از روش جدیدی برای یادگیری مدل های زبانی بزرگ رونمایی کرد که به طور یکپارچه اطلاعات متنی و بصری را با هم ترکیب می کند. انتظار می رود که Apple تعدادی از ویژگی های هوش مصنوعی را در کنفرانس WWDC در ماه ژوئن معرفی خواهد کرد.
همچنین بخوانید: