Microsoft впервые представила свои модели искусственного интеллекта. До этого компания в основном использовала решения OpenAI, интегрируя их в инфраструктуру Azure и продукты Copilot. Теперь у нее есть собственные системы — MAI-Voice-1 и MAI-1-preview.
MAI-Voice-1 — это модель генерации речи. Она уже применяется в приложениях Copilot Daily, которое формирует аудиосводки новостей и погоды, и в Podcasts. Для знакомства с её возможностями создан интерфейс Copilot Labs. С помощью функции Copilot Audio Expressions пользователи могут вставлять текст, выбирать голос и стиль озвучки, а затем скачивать готовый аудиофайл. По данным компании, модель работает с высокой скоростью: одна минута речи создаётся менее чем за секунду при использовании одного графического процессора.
Вторая модель, MAI-1-preview, доступна в виде публичной бета-версии на платформе LMArena. Это первая фундаментальная модель Microsoft, созданная полностью собственными силами. Она обучена по архитектуре MoE (смешанная модель экспертов) на почти 15 000 ускорителях Nvidia H100. По информации Microsoft, модель эффективно выполняет инструкции и отвечает на вопросы пользователей. В ближайшие недели её планируют задействовать в ряде текстовых функций Copilot.
В компании подчёркивают, что MAI-1-preview не заменяет модели OpenAI. В дальнейшем Microsoft намерена сочетать собственные разработки с партнёрскими решениями и проектами сообщества с открытым исходным кодом. Модель также доступна через API для ограниченного круга тестировщиков.