مایکروسافت Teams امکان شبیه‌سازی صدا به زبان‌های مختلف را فراهم می‌کند

مایکروسافت به زودی ویژگی جدیدی به Teams اضافه می‌کند که به کاربران اجازه می‌دهد تا صدا خود را شبیه‌سازی کرده…
مایکروسافت Teams امکان شبیه‌سازی صدا به زبان‌های مختلف را فراهم می‌کند

مایکروسافت به زودی ویژگی جدیدی به Teams اضافه می‌کند که به کاربران اجازه می‌دهد تا صدا خود را شبیه‌سازی کرده و از آن برای صحبت به زبان‌های مختلف در جلسات استفاده کنند.

مایکروسافت Teams قابلیت شبیه‌سازی صدا به زبان‌های مختلف را ارائه می‌کند

این شرکت در رویداد Microsoft Ignite 2024 از ابزار جدیدی به نام Interpreter in Teams رونمایی کرد. این ابزار قابلیت ترجمه گفتار به گفتار همزمان را ارائه می‌دهد و به کاربران اجازه می‌دهد تا از اوایل سال 2025، صدای خود را به حداکثر 9 زبان مختلف شبیه‌سازی کنند. این زبان‌ها شامل انگلیسی، فرانسوی، آلمانی، ایتالیایی، ژاپنی، کره‌ای، پرتغالی، چینی ماندارین و اسپانیایی هستند.

جارد اسپاتارو مدیر بازاریابی مایکروسافت، در یک پست وبلاگی قابلیت شبیه‌سازی صدا در مایکروسافت تیمز را چنین توصیف کرده است:

تصور کنید بتوانید در زبان دیگری دقیقاً مانند خودتان صحبت کنید. ابزار Interpreter in Teams ترجمه گفتار به گفتار در زمان واقعی را در طول جلسات فراهم می‌کند و به شما این امکان را می‌دهد تا برای تجربه ای شخصی‌تر و جذاب‌تر، صدای خود را شبیه‌سازی کنید.

مایکروسافت جزئیات فنی زیادی در مورد این ویژگی که تنها برای مشترکین Microsoft 365 در دسترس خواهد بود، ارائه نداده است. با این حال، این شرکت تأکید کرده است که این ابزار هیچ داده بیومتریک کاربری را ذخیره نمی‌کند و احساسات مصنوعی به صداها اضافه نمی‌کند. همچنین، کاربران می‌توانند این ویژگی را از تنظیمات مایکروسافت تیمز غیرفعال کنند.

سخنگوی مایکروسافت گفته است که هدف از طراحی Interpreter، انتقال دقیق و حداکثری پیام گوینده، بدون افزودن هرگونه تفسیر یا اطلاعات اضافی است. قابلیت شبیه‌سازی صدا تنها با کسب رضایت صریح کاربر فعال می‌شود. کاربران می‌توانند این رضایت را از طریق فعال‌سازی گزینه Voice simulation consent در تنظیمات اعلام کنند.

در سال‌های اخیر، چندین شرکت فناوری به توسعه فناوری‌های تولید صداهای دیجیتال بسیار طبیعی پرداخته‌اند. متا اخیراً از آزمایشی خبر داد که در آن ابزاری برای ترجمه خودکار صدا در ریلزهای اینستاگرام توسعه یافته است. همچنین، پلتفرم ElevenLabs امکان تولید گفتار چندزبانه با کیفیت بالا را فراهم می‌کند.

اگرچه ترجمه‌های ماشینی معمولاً از نظر واژگانی غنای کمتری نسبت به ترجمه‌های انسانی دارند و در انتقال دقیق اصطلاحات عامیانه، استعاره‌ها و تفاوت‌های فرهنگی با چالش مواجه‌اند، اما مزیت صرفه‌جویی در هزینه، این فناوری را برای بسیاری از کاربردها جذاب کرده است. بر اساس گزارش Markets and Markets، ارزش بازار فناوری‌های پردازش زبان طبیعی، از جمله ترجمه ماشینی، تا سال 2026 به 35.1 میلیارد دلار خواهد رسید.

البته یکی از این چالش‌های این فناوری، تولید محتوای جعلی به کمک هوش مصنوعی است که با نام دیپ‌فیک نیز شناخته می‌شود. در سال جاری، ویدیوهای جعلی زیادی از شخصیت‌های مشهوری مانند جو بایدن، تیلور سوئیفت و کامالا هریس، میلیون‌ها منتشر شده است. طبق گزارش FTC، خسارات ناشی از کلاهبرداری‌های مبتنی بر جعل هویت در سال گذشته از مرز یک میلیارد دلار گذشت.

در یک نمونه‌ واقعی، گروهی از مجرمان سایبری با استفاده از هوش مصنوعی، جلسه‌ای مجازی در پلتفرم تیمز برگزار کردند که به قدری واقعی بود که شرکت هدف، مبلغ 25 میلیون دلار را به حساب آن‌ها واریز کرد.

با توجه به این خطرات، شرکت OpenAI تصمیم گرفته تا فناوری تولید صدای خود یعنی Voice Engine را عرضه نکند. اگرچه قابلیت ترجمه همزمان در مایکروسافت تیمز کاربرد محدودی دارد، اما این بدان معنا نیست که در برابر سوء استفاده ایمن خواهد بود.

منبع خبر