Amazon создала крупнейшую на сегодняшний день ИИ-модель для преобразования текста в речь

  • 19.02.2024 23:58
  • 2.9k+

Американская технологическая компания Amazon анонсировала прорыв в области ИИ-технологий: BASE TTS (Big Adaptive Streamable TTS with Emergent options), нейросеть, способную преобразовывать текст в речь с беспрецедентной реалистичностью.

Создатели нейросети представили результаты своих наработок на портале научных публикаций arXiv.
Отмечается, что ИИ-модель имеет 980 млн параметров и обучена на 100 тыс. часов записей речи преимущественно на английском языке.
При этом разработчики BASE TTS не ограничились английским. Модель способна правильно произносить слова и фразы на других языках, включая известные выражения, такие как "adios, amigo".
BASE TTS уже прошла тестирование на небольших наборах данных. Результаты показали, что нейросеть способна использовать сложные существительные, выражать эмоции, применять пунктуацию и даже задавать вопросы с акцентом на нужных словах.
В Amazon видят большой потенциал BASE TTS в образовательной сфере. Модель может стать обучающим приложением, помогая людям с дислексией и другими трудностями чтения.


вчера 13:32
2.5k+

Все роботы с ИИ провалили испытания на безопасность для человека

Роботы, управляемые большими языковыми моделями (LLM), показали склонность к дискриминации и к одобрению действий, которые могут причинить людям физический вред. К такому выводу пришли ученые из Королевского колледжа Лондона и Университета Карнеги-Меллон по итогам совместных исследовании...

15.11.2025 00:14
8.4k+

Представлен первый в России человекоподобный робот. Он упал, сделав несколько шагов

В Москве представили первого российского человекоподобного робота с искусственным интеллектом. Об этом 11 ноября сообщил ТАСС со ссылкой на Национальную технологическую коалицию. Как сообщает агентство «Москва», робот по имени Айдол (Aidol) не удержал равновесие и упал уже в начале презентации...

20.10.2025 17:37
1.5k+

ИИ-модель от Google DeepMind «разговорил» раковые клетки и нашёл их слабое место

Учёные долго искали способы заставить опухоли проявляться на ранних стадиях, когда иммунная система человека ещё способна их эффективно атаковать. Теперь к этой задаче подключили искусственный интеллект, и результаты оказались впечатляющими...

18.10.2025 12:40
2k+

Google обновила Veo до версии 3.1: больше реализма, звука и кинематографичности

Google выпустила обновлённую версию своего ИИ-генератора видео — Veo 3.1. Новая модель отличается более реалистичным изображением, точным следованием текстовым запросам и улучшенным звуковым оформлением. По сравнению с версией, выпущенной в мае, Veo 3...