فناوری و ارتباطات

دیپ فیک صوتی چیست + مزایا و معایب این تکنولوژی

فناوری دیپ فیک صوتی ( جعل عمیق )  که منجر به شبیه سازی اصوات یا تولید تقریباً کامل صدای افراد می شود ، می تواند برای اهداف خوب و بد استفاده شود. به عنوان مثال ، می توان از آن در خدمات ترکیبی صدا استفاده کرد تا صدا را به افرادی که به دلیل عوارضی مانند اسکلروز جانبی آمیوتروفیک ، آپراکسی ، آسیب مغزی ضربه ای ، سکته مغزی یا امثال این توانایی از دست داده اند ، بازگرداند.

دیپ فیک صوتی چیست؟

این فناوری در حال حاضر در صنایع فیلم و تلویزیون ، مراکز بازی و تلفن استفاده می شود و پتانسیل بیشماری برای استفاده از آن در رمزنگاری و درمان وجود دارد. در عین حال ، نمی توان تردید کرد که فناوری صوتی دیفتری تهدید بزرگی برای فرایندهای دموکراتیک ، به ویژه آنهایی که مربوط به حریم خصوصی هستند ، است. در صورت سو استفاده ، فناوری صوتی دیفتری می تواند منجر به کلاهبرداری ، فریب و آزار و اذیت شود.

بخوانید:  سخنان وزیر دادگستری در رابطه با فیلتر شبکه های اجتماعی

دقیقاً به دلیل این پتانسیل های خوب و بد ، اکنون زمان آن فرا رسیده است که به دقت به فناوری صوتی دیفتری توجه کنیم و آن را از راه هایی بررسی کنیم که خطر فریب مردم را کاهش می دهد ، به ویژه اینکه یک شخص مشهور چیزی گفته است. در واقع ، او این حرف را نزده است.

موارد استفاده برای مشاغل چیست؟ این ارقام نشان می دهد که فرصتی عالی برای سازمان های اقتصادی برای استفاده از فناوری های صوتی و ورود به مشاغل جدید وجود دارد. در سال 2018 ، AppDynamics گزارش داد که تا سال 2020 ، بیش از نیمی از جستجوهای مبتنی بر وب به صورت صوتی انجام می شود.

بخوانید:  يک تساوي بدون گل ديگر به تاريخ دربي اضافه شد

از طرف دیگر ، 61٪ از تصمیم گیران برتر IT گام دیگری فراتر رفته و انتظار دارند که دستورات صوتی برای یافتن اطلاعات از طریق اینترنت ، کاملاً جایگزین دستورات تایپ دستی شوند. و نسل جوان در این زمینه پیشتاز است – 84٪ از افراد قرن 21 از دستیارهای صوتی برای نظارت بر کارهای روزمره و مسئولیت های خود استفاده می کنند.

بیایید نگاهی به جوانب مثبت ، منفی و آینده منتظر فناوری صوتی Deepofac بیندازیم.

دیپ فیک صوتی چیست + مزایا و معایب این تکنولوژی

مزایای دیپ فیک صوتی

 

امکان صحبت طبیعی توسط افرادی که از مشکلات پزشکی رنج می برند

بخوانید:  توضیحاتی برای چرایی فیلترینگ تلگرام

توانایی برقراری ارتباط و اشتراک افکار و احساسات با کلمات بسیار مهم است و در واقع این یکی از معدود ویژگی هایی است که ما انسان ها را منحصر به فرد می کند. اما فناوری رایج صدای متداول فعلی می تواند برای افرادی که توانایی گفتار ندارند ، کارهای بیشتری انجام دهد.

به عنوان مثال کنترل صدا را در توسعه فناوری اتوماسیون خانگی در نظر بگیرید. شبیه سازی صدا می تواند به افرادی که قادر به گفتار طبیعی نیستند استقلال بیشتری داشته و از دستگاه هایی که توسط دستورات صوتی کنترل می شوند استفاده بهتری داشته باشند.

دستیارهای صوتی

بر اساس “پیش بینی دستیار دیجیتال و صدای مصنوعی دستگاه اووم” تا سال 2021 تعداد دستیارهای صوتی بیشتر از تعداد دستیارهای صوتی در کره زمین خواهد بود. بیایید به عنوان مثال دستیار صوتی Google را بررسی کنیم. صدای دستیار با استفاده از سیستم گفتاری Tacotron 2 تولید می شود که متکی به دو شبکه عصبی عمیق است.

بخوانید:  استقلالی ها در کنار خواننده زیرزمینی/عکس

شبکه اول با گذشت زمان متن را به یک تصویر بصری (یا طیف سنجی) از فرکانس های صدا تبدیل می کند و سپس یک سیستم WaveNet طیف سنجی را تجزیه و تحلیل می کند و عناصر صوتی را تشکیل می دهد. خروجی گفتاری است که تفاوت چندانی با گفتار عادی انسان ندارد و حتی می تواند کلمات بسیار دشوار را به خوبی تلفظ کند.

محتوای تعاملی برای دوره های یادگیری آنلاین

شبیه سازی صدا با هوش مصنوعی ، نیازی به یادداشت برداری یا تجدید نظر در هر کلاس برای یافتن خطاهای احتمالی را از بین می برد. از طرف دیگر ، هزینه و زمان سخنرانی های ضبط شده حرفه ای کاهش می یابد و دوره های یادگیری آنلاین در دسترس تر می شوند. این اتفاق مهمی نیست ، خصوصاً در بحران فعلی ، که همه گیری Covid-19 محدودیت های زیادی را برای مردم ایجاد کرده است.

بخوانید:  حمله دوباره مینانوند به منصوریان و استقلالی ها

معایب دیپ فیک صوتی

 

اخاذی

فیلم های جعلی اما بسیار واقع گرایانه از صحنه های آزار دهنده جنسی یا خشونت آمیز جنسی که با استفاده از ترکیبی از فناوری صوتی و تصویری ایجاد شده اند می توانند برای اخاذی از مردم استفاده کنند.

ایمیل های هرزنامه

اگر تاکنون ایمیلی با عبارت “برای کسب اطلاعات بیشتر در مورد روند انتقال پول با X Bank تماس بگیرید” دریافت کرده باشید ، احتمالاً نام ایمیل های هرزنامه را شنیده اید و هیچ توجهی به آنها نکرده اید. . اما یک تماس تلفنی از شخصی که شباهت زیادی به یکی از مخاطبان معتمد شما دارد و شما را ترغیب می کند به یک ایمیل پاسخ دهید ممکن است نظر شما را تغییر دهد و باعث شود کاری انجام دهید که بعداً آرزو می کردید آرزو می کردید هرگز انجام ندهید. .

بخوانید:  تکذیب مصوبه فیلترینگ تلگرام

رقابت غیرقانونی

ممکن است شخصی تظاهر به مدیرعاملی یک شرکت کند و در این سمت مهم ، شروع به انتشار اطلاعات مربوط به موضوع در تماس های تلفنی مربوط به گزارش های مالی کند. سهامداران و سرمایه گذاران فریب خواهند خورد و فکر می کنند قیمت سهام همان چیزی است که در واقع است. از همین روش مخرب می توان برای از بین بردن رقبای صنعتی استفاده کرد.

بخوانید:  مانیتورهای لمسی ۱۰ انگشتی AOC معرفی شدند + عکس

آینده دیپ فیک صوتی

 

استفاده در مدل بنگاه در بنگاه

با توجه به یافته های گزارش AppDynamics که در بالا ذکر شد ، استفاده گسترده از فناوری تولید مثل صدا دور از ذهن نیست. 69٪ از تصمیم گیرندگان فناوری اطلاعات در شرکت هایی کار می کنند که یا قبلاً در فناوری سرمایه گذاری کرده اند یا می خواهند طی سه سال آینده در آن سرمایه گذاری کنند.

خواه به دنبال تولید مثل صدا ، درمان مشکلات گفتاری ، بازی ، رمزنگاری یا هر چیز دیگری باشید ، از فناوری شبیه سازی صدا می توان در طیف گسترده ای از صنایع استفاده کرد. به عنوان مثال ، با توسعه یک سیستم زمان واقعی در دنیای بازی ، به گیمرها می توان از صداهای مختلف در گپ های درون بازی استفاده کرد. وقتی صحبت از فناوری صوتی دیفتری می شود ، جهان بسیار سریع در حال تغییر است.

بخوانید:  بازگشت دشمنان استقلالی قلعه نویی به لیگ برتر!

کلون صدا برای مراکز تماس

کمپانی Reespecher اکنون در حال کار بر روی فناوری های دستیابی به موفقیت است که به اپراتورهای آن طرف آب اجازه می دهد مانند بومی ها صدا کنند. بنابراین وقتی با یکی از این مراکز تماس می گیرید ، احساس خواهید کرد که با یک شهروند کشور خود صحبت می کنید. از طرف دیگر ، اپراتورهای رباتیک به زودی صدای انسانی تری خواهند داشت.

بخوانید:  امضا به سبک ژنرال قلعه نویی! +عکس

نتیجه

فناوری صوتی عمیق بدون شک خطرات خاص خود را به همراه دارد ، اما اولین قدم برای تمرکز مضاعف بر جنبه های مثبت فناوری ، شناسایی جنبه های منفی و تلاش برای کاهش آنها است. صداهای شبیه سازی شده که تفاوتی با صدای گوینده اصلی ندارند ، می تواند بهترین ابزار ممکن برای فیلمسازان ، گیمرها و سایر تهیه کنندگان رسانه باشد.

صداهای بازتولید شده دیجیتالی به زودی انواع احساسات و خلق و خوی را در بر می گیرند ، دستیارهای صوتی مانند Samsung Bixby ، Apple Siri یا Amazon Alexa نشان می دهند. و با رسیدن صداهایی که قادر به انتقال احساسات هستند ، مشاوره و همراهی شکل کاملاً جدیدی به خود می گیرد.

برگرفته از دیجیاتو

 

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا