- 2024-12-02
- 11 بازدید
- 0 دیدگاه
- اينترنت ، هوش مصنوعی
مایکروسافت Teams امکان شبیهسازی صدا به زبانهای مختلف را فراهم میکند
مایکروسافت به زودی ویژگی جدیدی به Teams اضافه میکند که به کاربران اجازه میدهد تا صدا خود را شبیهسازی کرده و از آن برای صحبت به زبانهای مختلف در جلسات استفاده کنند.
مایکروسافت Teams قابلیت شبیهسازی صدا به زبانهای مختلف را ارائه میکند
این شرکت در رویداد Microsoft Ignite 2024 از ابزار جدیدی به نام Interpreter in Teams رونمایی کرد. این ابزار قابلیت ترجمه گفتار به گفتار همزمان را ارائه میدهد و به کاربران اجازه میدهد تا از اوایل سال 2025، صدای خود را به حداکثر 9 زبان مختلف شبیهسازی کنند. این زبانها شامل انگلیسی، فرانسوی، آلمانی، ایتالیایی، ژاپنی، کرهای، پرتغالی، چینی ماندارین و اسپانیایی هستند.
جارد اسپاتارو مدیر بازاریابی مایکروسافت، در یک پست وبلاگی قابلیت شبیهسازی صدا در مایکروسافت تیمز را چنین توصیف کرده است:
تصور کنید بتوانید در زبان دیگری دقیقاً مانند خودتان صحبت کنید. ابزار Interpreter in Teams ترجمه گفتار به گفتار در زمان واقعی را در طول جلسات فراهم میکند و به شما این امکان را میدهد تا برای تجربه ای شخصیتر و جذابتر، صدای خود را شبیهسازی کنید.
مایکروسافت جزئیات فنی زیادی در مورد این ویژگی که تنها برای مشترکین Microsoft 365 در دسترس خواهد بود، ارائه نداده است. با این حال، این شرکت تأکید کرده است که این ابزار هیچ داده بیومتریک کاربری را ذخیره نمیکند و احساسات مصنوعی به صداها اضافه نمیکند. همچنین، کاربران میتوانند این ویژگی را از تنظیمات مایکروسافت تیمز غیرفعال کنند.
سخنگوی مایکروسافت گفته است که هدف از طراحی Interpreter، انتقال دقیق و حداکثری پیام گوینده، بدون افزودن هرگونه تفسیر یا اطلاعات اضافی است. قابلیت شبیهسازی صدا تنها با کسب رضایت صریح کاربر فعال میشود. کاربران میتوانند این رضایت را از طریق فعالسازی گزینه Voice simulation consent در تنظیمات اعلام کنند.
در سالهای اخیر، چندین شرکت فناوری به توسعه فناوریهای تولید صداهای دیجیتال بسیار طبیعی پرداختهاند. متا اخیراً از آزمایشی خبر داد که در آن ابزاری برای ترجمه خودکار صدا در ریلزهای اینستاگرام توسعه یافته است. همچنین، پلتفرم ElevenLabs امکان تولید گفتار چندزبانه با کیفیت بالا را فراهم میکند.
اگرچه ترجمههای ماشینی معمولاً از نظر واژگانی غنای کمتری نسبت به ترجمههای انسانی دارند و در انتقال دقیق اصطلاحات عامیانه، استعارهها و تفاوتهای فرهنگی با چالش مواجهاند، اما مزیت صرفهجویی در هزینه، این فناوری را برای بسیاری از کاربردها جذاب کرده است. بر اساس گزارش Markets and Markets، ارزش بازار فناوریهای پردازش زبان طبیعی، از جمله ترجمه ماشینی، تا سال 2026 به 35.1 میلیارد دلار خواهد رسید.
البته یکی از این چالشهای این فناوری، تولید محتوای جعلی به کمک هوش مصنوعی است که با نام دیپفیک نیز شناخته میشود. در سال جاری، ویدیوهای جعلی زیادی از شخصیتهای مشهوری مانند جو بایدن، تیلور سوئیفت و کامالا هریس، میلیونها منتشر شده است. طبق گزارش FTC، خسارات ناشی از کلاهبرداریهای مبتنی بر جعل هویت در سال گذشته از مرز یک میلیارد دلار گذشت.
در یک نمونه واقعی، گروهی از مجرمان سایبری با استفاده از هوش مصنوعی، جلسهای مجازی در پلتفرم تیمز برگزار کردند که به قدری واقعی بود که شرکت هدف، مبلغ 25 میلیون دلار را به حساب آنها واریز کرد.
با توجه به این خطرات، شرکت OpenAI تصمیم گرفته تا فناوری تولید صدای خود یعنی Voice Engine را عرضه نکند. اگرچه قابلیت ترجمه همزمان در مایکروسافت تیمز کاربرد محدودی دارد، اما این بدان معنا نیست که در برابر سوء استفاده ایمن خواهد بود.
ارسال دیدگاه