شرکت Apple مدل های زبان کوچک جدیدی به نام OpenELM معرفی کرد. این یک گام مهم در توسعه مدل های مولد هوش مصنوعی در نظر گرفته می شود. این نیز نیت را تأیید می کند Apple ارائه توابع هوش مصنوعی در دستگاه ها علاوه بر خدمات هوش مصنوعی ابری.
تا زمان Apple در حال آماده شدن برای اعلام ویژگی های هوش مصنوعی که در ماه ژوئن به آیفون می آیند، در حال پیشرفت سریع در این زمینه است. در ماه های اخیر محققان Apple مدل های مختلف هوش مصنوعی را ارائه کرد و گام جدیدی در این مسیر برداشت.
محققان مدلهای زبان خود را که آنها را OpenELM مینامند، در پلتفرم Hugging Face Hub منتشر کردهاند. این مدل ها به عنوان گام مهمی در استفاده از هوش مصنوعی مولد در دستگاه ها تلقی می شوند.
این مدلها که «مدلهای زبان کارآمد منبع باز» (OpenELM) نامیده میشوند، در هنگام حل مشکلات متنی، بهویژه در زمینههایی مانند نوشتن ایمیل، «بسیار کارآمد» توصیف میشوند. علاوه بر این، این مدل ها منبع باز هستند و توسط هر توسعه دهنده ای قابل استفاده هستند.
مدل های OpenELM در چهار اندازه مختلف موجود هستند و می توان آنها را به عنوان "مدل های زبان کوچک" توصیف کرد. اندازه این مدل ها 270 میلیون پارامتر، 450 میلیون پارامتر، 1,1 میلیارد پارامتر و 3 میلیارد پارامتر است. پارامترها نشان می دهند که مدل چند متغیر می تواند از مجموعه داده های آموزشی بیاموزد.
به عنوان مثال، برای درک اینکه اندازه مدل چقدر کوچک است، Microsoft اخیراً مدل جدید هوش مصنوعی خود Phi-3 را معرفی کرده و آن را "کوچکترین مدل هوش مصنوعی ما" نامیده است. اندازه این مدل تنها 3,8 میلیارد پارامتر است. برای مقایسه، مدل ها Apple می تواند تا 270 میلیون پارامتر داشته باشد. اندازههای کوچکتر به این معنی است که هزینه کمتری دارند و میتوان آنها را برای کارآمدتر در دستگاههایی مانند تلفن همراه و لپتاپ بهینه کرد.
همچنین بخوانید: