وقتی عكس ها به حرف می آیند!

وقتی عكس ها به حرف می آیند! به گزارش فیكس سرور پژوهشگران آزمایشگاه هوش مصنوعی شركت سامسونگ در روسیه، سیستمی توسعه داده اند كه می تواند تنها از روی تصاویر افراد، مدل صحبت كردن آنها را شبیه سازی كند.


به گزارش فیكس سرور به نقل از ایسنا و به نقل از سی نت، پیشرفت فناوری خوب است، اما در گاهی موارد ترسناك می شود؛ چونكه حالا هوش مصنوعی سامسونگ می تواند تنها از روی تصاویر افراد، مدل صحبت كردن آنها را شبیه سازی كند؛ برای مثال امكان دارد در آینده افراد بتوانند تنها از روی عكس شما در حساب كاربریتان در شبكه های اجتماعی مدل صحبت كردن شما را ببینند.
غول فناوری كره ای اخیراً یك سیستم هوش مصنوعی "دیپ فیك" (deepfake) جدیدی را توسعه داده است كه می تواند تنها با داشتن یك تصویر از افراد، نحوه حرف زدن آنها را شبیه سازی كند.
البته این فناوری آنچنان كه فكر می كنید ترسناك هم نیست و می توان بعنوان نوعی سرگرمی هم به آن نگاه كرد؛ چونكه توسط آن می توانید مدل حرف زدن مشاهیر جهان را هم شبیه سازی كنید.
برای مثال شاید برای برخی همیشه یك معما بود كه "مونالیزا" چگونه حرف می زد، اما حالا تنها با وارد كردن پرتره او به این سیستم می توانید این معما را حل كنید. این نرم افزار دیپ فیك هم همانند فتوشاپ با استفاده از یادگیری ماشین می تواند مدل صحبت كردن افراد را شبیه سازی كند.
آزمایشگاه هوش مصنوعی سامسونگ، سیستم خویش را "صحبت عصبی واقع گرایانه" (realistic neural talking heads) نامید. اصطلاح " talking heads " اشاره به ژانر ویدئویی دارد كه این سیستم می تواند ایجاد كند. كلمه "عصبی" (neural) هم به شبكه های عصبی مرتبط می باشد. شبكه های عصبی نوعی سیستم یادگیری ماشین هستند كه ساختار مغز انسان را تقلید می كنند.
به قول محققان می توان از این سیستم در بازی های ویدئویی و یا فیلم ها استفاده نمود. آنها افزودند: چنین سیستمی كاربردهایی در فناوری دورحضوری یا حضور از دور (Telepresence) هم دارد. دورحضوری به فناوری ای گفته می شود كه به فرد اجازه می دهد حضورش را از طریق دور در مكانی دیگر احساس كند، گاهی این حضور می تواند به صورت تله رباتیك یا كنفرانس ویدئویی باشد.
از آن جایی كه در توسعه این سیستم در ابتدا تعداد زیادی عكس از یك فرد مورد نیاز بود، ازاین رو محققان تصاویر زیادی از افراد مشهور (هنرمندان یا سیاستمداران) را به آن وارد كردند.
جمله معروف " پیش از هر چیز دیگر، آمادگی كلید موفقیت استِ"مبتكر، دانشمند و مخترع تلفن "الكساندر گراهام بل" الهام بخش سامسونگ برای طراحی این سیستم بوده است. این سیستم با یك مرحله طولانی به نام "فرا یادگیری" (meta-learning stage) شروع می كند و در آن مرحله تعداد زیادی از فیلم ها را تماشا می كند تا بدانند چهره انسان چگونه هنگام صحبت حركت می كنند و بعد از آن با داشتن یك یا چند تصویر می تواند مدل صحبت كردن افراد را شبیه سازی كند.
مرورگر شما از ویدئو پشتیبانی نمی نماید.
فایل آنرا از اینجا دانلود كنید: video/mp4

1398/03/04
21:54:49
5.0 / 5
3775
این مطلب را می پسندید؟
(1)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب
نظر شما در مورد این مطلب
نام:
ایمیل:
نظر:
سوال:
= ۵ بعلاوه ۲
تعمیر سرور فیکس سرور

fixserver.ir - حقوق مادی و معنوی سایت فیكس سرور محفوظ است

فیكس سرور

سرور و هاست و دامین