دیپ فیک، دوبله فیلم‌ها را طبیعی‌تر می‌کند

سالانه فیلم‌هایی بسیار زیادی در سراسر جهان تولید می‌شوند که گاهی از میان آن‌ها آثار بی‌نظیری به دنیای سینما وارد می‌شوند که توجه همه دوستداران هنر را به خود جلب می‌کنند؛ اما زبان‌های خارجی زیادی وجود دارند که تعداد کمی از انسان‌ها به آن‌ها مسلط هستند و به همین دلیل، زیرنویس و دوبله وارد عمل می‌شوند.

به گزارش گیزمودو، در این میان، عده‌ای هستند که زیرنویس را یکی از عوامل حواس‌پرتی هنگام تماشای فیلم می‌دانند و به همین دلیل، به سمت آثار دوبله می‌روند تا بتوانند با خیال راحت و تمرکز بالا آن را نگاه کنند؛ اما دوبله نیز می‌تواند باعث حواس‌پرتی شود. هنگامی که حرکات لب یک بازیگر کاملاً با آنچه می‌گوید هماهنگ نباشد، چنین مشکلی پیش می‌آید؛ بنابراین شرکتی به نام Flawless یک راه‌ حل مبتنی بر هوش مصنوعی خلق کرده است که می‌تواند این مسئله را حل کند. در این روش، عملکرد چهره یک بازیگر با نمونه‌ای که با زبان مقصد تطابق دارد جایگزین می‌شود تا حرکات لب کاملا شبیه حالتی باشند که کلمات در آن زبان بیان می‌شوند.

در ادامه ویدئویی را که Flawless از این فناوری منتشر کرده است مشاهده می‌کنید:

دلایل بسیار خوبی برای نگرانی در مورد استفاده از هوش مصنوعی و ابزارهای شبکه عصبی برای دست‌کاری عکس‌ها و ویدئوها وجود دارد. این فناوری به قدری قدرتمند است که می‌توان به کمک آن موقعیت‌هایی ایجاد کرد که واقعاً اتفاق نیفتاده‌اند یا ویدئویی از سخنرانی شخصیتی معروف درست کرد که حتی یک کلمه از حرف‌های گفته‌شده صحیح نباشد. برای مثال مدتی پیش دیپ‌فیک شخصیت‌هایی مانند باراک اوباما، تام کروز و دونالد ترامپ در فضای مجازی منتشر شد که توجه افرادی بسیاری را به خود جلب کرد؛ اما این ابراز دارای پتانسیل هیجان‌انگیزی برای مصارف دیگر است. برای مثال با استفاده از دیپ فیک می‌توان هزینه ساخت فیلم‌ها را کاهش داد.

نگرانی‌های کنونی مانند زمانی است که گرافیک رایانه پیشرفت کرد و به لطف آن فیلم‌هایی مانند نابودگر ۲ و پارک ژوراسیک ساخته شد. این فناوری جدید جلوه‌های بصری واقع‌بینانه‌ای به مخاطبان نشان داد که تابه‌حال ندیده بودند و همین مسئله باعث شد علاوه‌ بر هیجان‌زده شدن، نگران شوند؛ اما پیشرفت به همین‌جا ختم نشد و تا جایی ادامه پیدا کرد که اکنون هر فرد آماتوری می‌تواند در خانه خود، با داشتن یک تلفن هوشمند و یک لپ‌تاپ، بدون نیاز به بودجه بالا، جلوه‌های ویژه‌ای در سطح هالیوود خلق کند. می‌توانید همین حالا با جستجو در یوتیوب بعضی از نمونه‌های تولیدشده توسط افراد مختلف را مشاهده کنید.

استفاده از این ابزارها نیز به لطف پیشرفت‌های مداوم در پردازش تصویر با استفاده از هوش مصنوعی، آسان‌تر شده است. پاک کردن اشیاء در یک ویدئو کلیپ، زمانی یک فرایند بسیار وقت‌گیر بود که نیاز به کارهای پیچیده و تنظیمات فریم به فریم داشت؛ اما اکنون حذف این موارد یک ویژگی استاندارد و خودکار در ادوبی افتر افکت است.

دیپ فیک لب Truesync

کاری که Flawless وعده داده با نرم‌افزار TrueSync خود انجام بدهد، این است که از همان ابزارهایی که مسئول تولید ویدئوهای دیپ فیک هستند برای دست‌کاری و تنظیم چهره بازیگران در فیلم استفاده کند تا حرکات دهان و ماهیچه‌های صورت آن‌ها با زبان مقصد تطابق بیشتری داشته باشد؛ بنابراین اگر فیلمی برای مثال به زبان انگلیسی ساخته ‌شود و تماشاچیان در برلین آن را به زبان آلمانی تماشا ‌کنند، با استفاده از این فناوری به نظر می‌رسد همه بازیگران آلمانی صحبت می‌کنند.

اما آیا واقعا این کار لازم است؟ این مسئله‌ای است که باید روی آن بیشتر بحث شود. انگل (Parasite)، فیلم کره‌ای برنده جایزه اسکار ۲۰۱۹، بار دیگر مسئله دوبله یا زیرنویس برای یک فیلم خارجی را زنده کرد. بونگ جون هو، کارگردان این فیلم، هنگام دریافت جایزه گفت اگر زیرنویس را به فیلم‌های خارجی اضافه کنید، می‌توانید به طیف وسیعی از آثار دنیا دسترسی داشته باشید.

عده‌ای معتقدند بودن متنی زیر فیلم که به‌سرعت جای خود را با متن دیگری عوض می‌کند، باعث حواس‌پرتی مخاطبان می‌شود. برخی نیز بر این باورند که هیچ‌وقت گوینده نمی‌تواند احساس آن لحظه بازیگر را با صدای خود منتقل کند و برای لذت بردن کامل از یک فیلم باید همه بخش‌های آن به مخاطب منتقل شوند.

توسعه‌دهندگان Flawless می‌گویند:

در قلب این سیستم، موتوری برای حفظ عملکرد وجود دارد که تمام ظرافت‌ها و احساسات بازیگر را حفظ می‌کند.

بنابراین با وجود جایگزینی چهره بازیگر، عملکرد ظریف اولیه آن‌ها حفظ و به‌صورت «ثابت» منتقل می‌شود. این یعنی حرکات لب صحیح است و تمام جزئیات صورت به‌درستی سر جای خود قرار دارند. این شرکت چند نمونه از آنچه ابزار TrueSync قادر به انجام آن است، در وب‌سایت خود به اشتراک گذاشته است. با تماشای این ویدئوها به نظر می‌رسد تام هنکس در فارست گامپ به زبان ژاپنی صحبت می‌کند؛ آن‌ هم بدون اینکه تپق بزند.

مقاله‌های مرتبط:دیپ فیک چیست؛ وقتی مرزی بین حقیقت و دروغ باقی نمی‌ماندتشخیص ویدئوهای دیپ فیک سخت‌تر شد

اما باید به یک مسئله اشاره کرد. درست است که این فناوری می‌تواند لب‌های بازیگر را کاملا با جملاتی به زبان دیگر هماهنگ کند؛ اما انگار مشکلی در نتیجه آن وجود دارد که باعث می‌شود تصویر نهایی کمی مصنوعی به نظر برسد. فیلم‌های خروجی مانند اجراهای اولیه طبیعی به نظر نمی‌رسند که احتمالا دلیلش این است که فناوری پشت TrueSync هنوز در مراحل ابتدایی خود قرار دارد. حتی شرکت‌هایی مانند دیزنی نیز در تلاش هستند کیفیت دیپ فیک را ارتقا بدهند تا بتوانند کیفیت آثار خود را بهتر کنند.

سؤال بزرگ‌تر این است که آیا راه‌ حل جدید Flawless بیشتر حواس مخاطب را نسبت به دوبله و زیرنویس پرت نمی‌کند؟ باید این موارد بررسی شوند. در نهایت باید محاسبه شود آیا زحمتی که برای دوباره طراحی کردن لب‌های بازیگران برای هر فیلم کشیده می‌شود، منطقی و ضروری است؟

نظر شما همراهان زومیت درباره ابزار TrueSync و نتیجه نهایی آن چیست؟ به نظر شما انجام چنین کاری برای همگام‌سازی لب‌های بازیگران با دوبله لازم است؟

شرکت Flawless از فناوری دیپ‌فیک برای همگام‌سازی لب‌های بازیگران با زبان دوبله مقصد استفاده می‌کند.