Amazon создала крупнейшую на сегодняшний день ИИ-модель для преобразования текста в речь

  • 19.02.2024 23:58
  • 2.9k+

Американская технологическая компания Amazon анонсировала прорыв в области ИИ-технологий: BASE TTS (Big Adaptive Streamable TTS with Emergent options), нейросеть, способную преобразовывать текст в речь с беспрецедентной реалистичностью.

Создатели нейросети представили результаты своих наработок на портале научных публикаций arXiv.
Отмечается, что ИИ-модель имеет 980 млн параметров и обучена на 100 тыс. часов записей речи преимущественно на английском языке.
При этом разработчики BASE TTS не ограничились английским. Модель способна правильно произносить слова и фразы на других языках, включая известные выражения, такие как "adios, amigo".
BASE TTS уже прошла тестирование на небольших наборах данных. Результаты показали, что нейросеть способна использовать сложные существительные, выражать эмоции, применять пунктуацию и даже задавать вопросы с акцентом на нужных словах.
В Amazon видят большой потенциал BASE TTS в образовательной сфере. Модель может стать обучающим приложением, помогая людям с дислексией и другими трудностями чтения.


07.03.2026 17:10
910

OpenAI представила GPT-5.4. В нем контекстное окно увеличили до миллиона токенов

OpenAI представила новую языковую модель GPT-5.4. Разработчики продолжают развивать линейку систем искусственного интеллекта, уделяя больше внимания решению сложных задач, программированию и работе с различными инструментами...

06.03.2026 12:05
2.7k+

В GPT-5.4 появится режим экстремального рассуждения

В модели GPT-5.4 может появиться специальный режим обработки сложных запросов. Об этом сообщает издание The Information. По данным источника, в таком режиме модель будет использовать больше времени и вычислительных ресурсов для решения задач, требующих сложной логики и детального анализа...

27.02.2026 21:33
8.4k+

Новая модель Nano Banana 2 от Google получила поддержку 4K и все знания Gemini

Американская компания Google презентовала нейросеть Nano Banana 2. Разработчики называют ее «новейшей, передовой моделью обработки изображений», сообщают «Ведомости». Технология будет внедрена во все сервисы корпорации...

21.02.2026 17:41
1.7k+

Gemini 3.1 Pro оказалась умнее конкурентов, и к тому же заметно дешевле

Google представила новую ИИ-модель Gemini 3.1 Pro, предназначенную для задач, где требуется сложное логическое рассуждение, а не короткий ответ. Модель способна писать приложения, проводить исследования и даже создавать анимации...