Amazon создала крупнейшую на сегодняшний день ИИ-модель для преобразования текста в речь

  • 19.02.2024 23:58
  • 2.8k+
Amazon создала крупнейшую на сегодняшний день ИИ-модель для преобразования текста в речь

Американская технологическая компания Amazon анонсировала прорыв в области ИИ-технологий: BASE TTS (Big Adaptive Streamable TTS with Emergent options), нейросеть, способную преобразовывать текст в речь с беспрецедентной реалистичностью.

Создатели нейросети представили результаты своих наработок на портале научных публикаций arXiv.
Отмечается, что ИИ-модель имеет 980 млн параметров и обучена на 100 тыс. часов записей речи преимущественно на английском языке.
При этом разработчики BASE TTS не ограничились английским. Модель способна правильно произносить слова и фразы на других языках, включая известные выражения, такие как "adios, amigo".
BASE TTS уже прошла тестирование на небольших наборах данных. Результаты показали, что нейросеть способна использовать сложные существительные, выражать эмоции, применять пунктуацию и даже задавать вопросы с акцентом на нужных словах.
В Amazon видят большой потенциал BASE TTS в образовательной сфере. Модель может стать обучающим приложением, помогая людям с дислексией и другими трудностями чтения.


16.11.2024 09:02
4k+

18 декабря в Ашхабаде пройдет международная конференция по ИИ-технологиям

18 декабря в Инженерно-технологическом университете Туркменистана имени Огуз хана планируется провести Международную научно-практическую конференцию «Умный город: технологии управления, цифровые, умные и ИИ-технологии...

28.10.2024 23:08
1.8k+

СМИ: OpenAI готовит к запуску Orion – новый флагман ИИ в 100 раз мощнее GPT-4

Компания OpenAI разрабатывает новую ИИ-модель под названием Orion, которая, по предварительным данным, будет в 100 раз мощнее своей предшественницы GPT-4. Публикация издания The Verge ссылается на несколько источников...

26.10.2024 23:36
2k+

Яндекс научила свою языковую модель YandexGPT 4 «рассуждать»

Яндекс объявил о запуске нового поколения языковых моделей YandexGPT 4, включающего мощную нейросеть Pro и облегчённую версию Lite, сообщает ресурс IXBT. Разработчики утверждают, что новые модели превосходят предшествующие...

09.10.2024 23:22
1.2k+

OpenAI открыла сторонним разработчикам возможности для создания голосовых ИИ-приложений

Компания OpenAI представила новые инструменты для сторонних разработчиков, упрощающие создание голосовых приложений на основе искусственного интеллекта (ИИ). Теперь разработчики могут использовать единый набор...