Root Nationاخباراخبار فناوری اطلاعاتمدل سورا هوش مصنوعی OpenAI ویدیوهای دقیقه‌ای را از پیام‌های متنی تولید می‌کند

مدل سورا هوش مصنوعی OpenAI ویدیوهای دقیقه‌ای را از پیام‌های متنی تولید می‌کند

-

OpenAI مدل جدیدی را معرفی کرد هوش مصنوعی Sora که قادر به تولید ویدیوهای با کیفیت بالا تا یک دقیقه بر اساس درخواست های متنی است. Sora که در زبان ژاپنی به معنای "آسمان" است، به این زودی در دسترس عموم قرار نخواهد گرفت، اما این شرکت آن را در اختیار گروه کوچکی از دانشمندان و محققان قرار خواهد داد تا آسیب و احتمال سوء استفاده را ارزیابی کنند.

OpenAI

وب‌سایت این شرکت می‌گوید: «سورا می‌تواند صحنه‌های پیچیده با شخصیت‌های متعدد، انواع حرکت‌های خاص و جزئیات دقیق شی و پس‌زمینه تولید کند». "مدل نه تنها آنچه را که کاربر در درخواست پرسیده است، بلکه چگونگی وجود این چیزها در دنیای فیزیکی را نیز درک می کند."

یکی از ویدیوهای تولید شده توسط Sora، زوجی را نشان می‌دهد که در میان توکیوی برفی قدم می‌زنند و شکوفه‌های گیلاس و دانه‌های برف در اطراف آن‌ها می‌چرخند، در حالی که ویدیوی دیگر ماموت‌های پشمالوی واقعی را نشان می‌دهد که در یک چمنزار پوشیده از برف در پس زمینه رشته‌های کوه پوشیده از برف قدم می‌زنند.

OpenAI می گوید این مدل با "درک عمیق زبان" کار می کند که به آن اجازه می دهد سرنخ های متن را تفسیر کند. با این حال، تقریباً مانند تمام تولیدکنندگان تصویر و ویدیو با هوش مصنوعی، Sora کامل نیست. OpenAI همچنین هشدار می‌دهد که علت و معلول کردن این مدل ممکن است دشوار باشد - برای مثال، می‌تواند ویدیویی از یک فرد در حال خوردن یک کوکی تولید کند، اما ممکن است علامت گاز گرفتن نداشته باشد.

سورا اولین مدل تبدیل متن به ویدئو نیست. شرکت های دیگر، از جمله متا، گوگل و Runway، یا به ابزارهای تبدیل متن به ویدیو اشاره کرده اند یا آنها را در دسترس عموم قرار داده اند. با این حال، هیچ ابزار دیگری در حال حاضر قادر به تولید یک ویدیوی 60 ثانیه ای نیست. سورا همچنین به‌جای جمع‌آوری فریم به فریم آن‌ها مانند سایر مدل‌ها، کل ویدیوها را یک‌باره تولید می‌کند، بنابراین اشیاء در ویدیو حتی زمانی که به طور موقت از دید ناپدید می‌شوند، دست نخورده باقی می‌مانند.

ظهور ابزارهای تبدیل متن به ویدیو نگرانی هایی را در مورد پتانسیل آنها برای ایجاد آسان تر ویدیوهای جعلی با ظاهر واقعی ایجاد کرده است. و هوش مصنوعی مولد به طور گسترده‌تر با واکنش هنرمندان و کارگران خلاق مواجه شده است که نگران این هستند که این فناوری به طور بالقوه جایگزین آنها شود.

OpenAI گفت که در حال کار با کارشناسان در زمینه هایی مانند اطلاعات نادرست، محتوای نفرت انگیز و سوگیری است تا ابزار را قبل از در دسترس قرار دادن آن برای عموم آزمایش کند. این شرکت همچنین در حال توسعه ابزارهایی است که می تواند ویدیوهای ایجاد شده توسط Sora را شناسایی کند و متادیتا را در ویدیوهای ایجاد شده قرار دهد تا کشف آنها را آسان تر کند. این شرکت از بیان نحوه آموزش سورا خودداری کرد، اما گفت که از «ویدیوهای دامنه عمومی» و ویدیوهای دارای مجوز از صاحبان حقوق استفاده می کند.

همچنین بخوانید:

منبعکالا
ثبت نام
اطلاع رسانی در مورد
مهمان

0 نظرات
بررسی های جاسازی شده
مشاهده همه نظرات