Amazon создала крупнейшую на сегодняшний день ИИ-модель для преобразования текста в речь

  • 19.02.2024 23:58
  • 2.9k+

Американская технологическая компания Amazon анонсировала прорыв в области ИИ-технологий: BASE TTS (Big Adaptive Streamable TTS with Emergent options), нейросеть, способную преобразовывать текст в речь с беспрецедентной реалистичностью.

Создатели нейросети представили результаты своих наработок на портале научных публикаций arXiv.
Отмечается, что ИИ-модель имеет 980 млн параметров и обучена на 100 тыс. часов записей речи преимущественно на английском языке.
При этом разработчики BASE TTS не ограничились английским. Модель способна правильно произносить слова и фразы на других языках, включая известные выражения, такие как "adios, amigo".
BASE TTS уже прошла тестирование на небольших наборах данных. Результаты показали, что нейросеть способна использовать сложные существительные, выражать эмоции, применять пунктуацию и даже задавать вопросы с акцентом на нужных словах.
В Amazon видят большой потенциал BASE TTS в образовательной сфере. Модель может стать обучающим приложением, помогая людям с дислексией и другими трудностями чтения.


27.08.2025 15:44
4.9k+

Китай строит первый в мире подводный дата-центр для искусственного интеллекта

В Китае ведется строительство первого в мире подводного центра обработки данных для искусственного интеллекта. Объект находится в 10 км от побережья Шанхая, а его питание будет обеспечивать близлежащая морская ветроэлектростанция, передает Live Science...

22.08.2025 08:10
1k+

Google добавила в Gemini инструмент для озвучивания документов

Разработчики Google внедрили в сервис «Google Документы» новую функцию, позволяющую преобразовывать текст в аудиоформат. Инструмент работает на базе модели искусственного интеллекта Gemini. Опция «Аудио» появилась в меню «Инструменты» в верхней части рабочего пространства...

21.08.2025 16:21
1.7k+

Первый в космосе ИИ-ассистент: Китай вывел на орбиту систему «Укун»

Китайские астронавты на станции «Тяньгун» получили первого ИИ-помощника. Система под названием «Укун», созданная на базе отечественной открытой модели, была доставлена на станцию грузовым кораблем «Тяньчжоу-9» вместе с новыми скафандрами, фруктами и другими запасами...

18.08.2025 09:58
3.1k+

OpenAI вступает в территорию Neuralink. Компания инвестирует в создание мозговых чипов

Американская компания OpenAI и её соучредитель Сэм Альтман собираются инвестировать в стартап Merge Labs, который разрабатывает интерфейсы для мозговых имплантов. Об этом сообщила Financial Times со ссылкой на три анонимных источника...