مقدمه
از آغاز پردهبرداری از sora در اوایل سال جاری میلادی، شرکت سازنده و صاحب آن، یعنی open ai به رغم اعتراضات و اعتصابات گسترده نویسندگان و بازیگران در سال گذشته، به تبلیغات عمومی برای این فناوری ادامه داده است و ارائههای خصوصی از آن برای مشتریهای بالقوه خود همچون شرکتهای بزرگ فیلمسازی نظیر پارامونت، برادران وارنر دیسکاوری و یونیورسال تدارک دیده است. با وجود اینکه هنوز گرد و غبار اعتصابات نویسندگان و بازیگران سال گذشته فروکش نکرده است، OpenAI برای مخاطبان سینما و سرگرمی، توانایی Sora در تبدیل دادههای متنی به ویدیوهای باکیفیت در عرض یک دقیقه یا کمتر را معرفی کرد. پیش از این نمایشهای اولیه، دسترسی به Sora به تیمی از متخصصان موسوم به «تیم قرمز» محدود بود که به دنبال اطلاعات نادرست و سوگیریها، و همچنین خطاهای بحرانی و ریسکهای آن بودند. در اواخر ماه مارس ۲۰۲۴، یکی از بنیانگذاران OpenAI به نام سم آلتمن Sora را به لسآنجلس برد تا هالیوود را برای پذیرش این فناوری ترغیب کند.
استفاده از این فناوری توسط غولهای فیلمسازی، میتواند منجر به احیای بسیاری از نگرانیهای مربوط به حق تکثیر و مالکیت فکری شود که پیشتر توسط سازندگان محتوا، به ویژه بازیگران و نویسندگان، مطرح شده بود. پیشرفتهای Sora، به دلیل درجه بسیار بالای دقت تصویری و جزئیات، آن را از نسلهای قبلی هوش مصنوعی تولیدکننده محتوا متمایز میکند. Sora، بر پایه مدل تولید تصویر ۲۰۲۳ شرکت صاحب و سازنده آن یعنی Open Ai به نام DALL·E 3 بنا شده است. DALL·E 3 میتواند بر اساس متن ورودی، تصاویر تازهای ایجاد کند. Sora مدل انتشار DALL·E 3 را با یک شبکه عصبی ترانسفورماتور ترکیب کرده است تا نویز اولیه (پیکسلهای نامشخص) را به تصاویر دنبالهدار تبدیل کند و با پردازش دادهها به صورت بخشبخش، توانایی عملکرد را افزایش دهد. اگرچه Sora هنوز در زمینه ثبات و ماندگاری اشیاء و انسجام در فواصل طولانی (صحنههای پیچیده) نواقصی دارد، اما درک این مدل از تعامل اشیاء و روابط فضایی به طور قابل توجهی از قابلیت نسلهای قبلی هوش مصنوعی فراتر رفته است و به همین دلیل پیشبینی میشود صنعت سرگرمی را شیوهای بنیادین تغییر دهد.
برای مطالعه متن کامل، لطفا به لینک مراجعه نمایید.