مدل ساخت تصویر با هوش مصنوعی MAI-Image-1 مایکروسافت معرفی شد

به اشتراک‌گذاری اولین مدل ساخت تصویر هوش مصنوعی داخلی مایکروسافت با نام MAI-Image-1 اکنون در…


مایکروسافت


به اشتراک‌گذاری

اولین مدل ساخت تصویر هوش مصنوعی داخلی مایکروسافت با نام MAI-Image-1 اکنون در دو محصول این شرکت یعنی Bing Image Creator و Copilot Audio Expressions در دسترس قرار گرفته است.

ویژگی‌های MAI-Image-1 مایکروسافت

مصطفی سلیمان، مدیر ارشد بخش هوش مصنوعی مایکروسافت، در پستی در پلتفرم ایکس نوشت که مدل تبدیل متن به تصویر MAI-Image-1 به‌زودی در اتحادیه اروپا نیز عرضه خواهد شد.

سلیمان در ادامه افزود که این مدل «در تولید تصاویر مربوط به غذا و مناظر طبیعی، همچنین در خلق نورپردازی هنری و جزئیات فوتورئالیستی واقعاً عملکرد درخشانی دارد». مایکروسافت پیش‌تر در وبلاگ خود جزئیات بیشتری درباره این مدل منتشر کرده و نوشته بود:

MAI-Image-1 در تولید تصاویر فوتورئالیستی مانند نورپردازی (برای مثال بازتاب نور و انعکاس‌ها)، مناظر طبیعی و بسیاری موارد دیگر برتری قابل‌توجهی دارد. این موضوع به‌ویژه در مقایسه با مدل‌های بزرگ‌تر و کندتر مشهود است. ترکیب سرعت و کیفیت در این مدل باعث می‌شود کاربران بتوانند ایده‌های خود را سریع‌تر روی صفحه نمایش دهند، به‌سرعت آن‌ها را تکرار و اصلاح کنند و سپس برای ادامه کار به ابزارهای دیگر منتقل شوند.

مایکروسافت همچنین اعلام کرده است که MAI-Image-1 در حالت Story Mode پلتفرم تبدیل متن به گفتار Copilot Audio Expressions، آثار هنری تولیدشده با هوش مصنوعی را برای همراهی با داستان‌های صوتی تولیدشده توسط هوش مصنوعی خلق خواهد کرد.

مردادماه امسال مایکروسافت نخستین مدل‌های هوش مصنوعی داخلی خود را معرفی کرد که شامل مدل گفتاری MAI-Voice-1 و مدل متنی MAI-1-preview بود. در آن زمان، این شرکت اعلام کرد که قصد دارد از MAI-1-preview در دستیار هوش مصنوعی Copilot در برخی موارد نامشخص استفاده کند که نشانه‌ای از کاهش وابستگی مایکروسافت به مدل‌های OpenAI بود. با این حال، مایکروسافت امروز اعلام کرده که چت‌بات Copilot در حال انتقال به مدل جدید GPT-5 متعلق به OpenAI است، در حالی‌که مدل‌های هوش مصنوعی شرکت آنتروپیک مانند Claude را نیز به‌عنوان گزینه‌هایی در اختیار کاربران قرار می‌دهد.

مدل MAI-Image-1 به‌عنوان یکی از سه مدل هوش مصنوعی موجود در وب‌سایت و اپلیکیشن تولید تصویر Bing Image Creator فهرست شده است. دو مدل دیگر DALL-E 3 و GPT-4o هستند که هر دو توسط OpenAI توسعه یافته‌اند.



منبع خبر