Amazon создала крупнейшую на сегодняшний день ИИ-модель для преобразования текста в речь

  • 19.02.2024 23:58
  • 2.9k+

Американская технологическая компания Amazon анонсировала прорыв в области ИИ-технологий: BASE TTS (Big Adaptive Streamable TTS with Emergent options), нейросеть, способную преобразовывать текст в речь с беспрецедентной реалистичностью.

Создатели нейросети представили результаты своих наработок на портале научных публикаций arXiv.
Отмечается, что ИИ-модель имеет 980 млн параметров и обучена на 100 тыс. часов записей речи преимущественно на английском языке.
При этом разработчики BASE TTS не ограничились английским. Модель способна правильно произносить слова и фразы на других языках, включая известные выражения, такие как "adios, amigo".
BASE TTS уже прошла тестирование на небольших наборах данных. Результаты показали, что нейросеть способна использовать сложные существительные, выражать эмоции, применять пунктуацию и даже задавать вопросы с акцентом на нужных словах.
В Amazon видят большой потенциал BASE TTS в образовательной сфере. Модель может стать обучающим приложением, помогая людям с дислексией и другими трудностями чтения.


20.10.2025 17:37
1.4k+

ИИ-модель от Google DeepMind «разговорил» раковые клетки и нашёл их слабое место

Учёные долго искали способы заставить опухоли проявляться на ранних стадиях, когда иммунная система человека ещё способна их эффективно атаковать. Теперь к этой задаче подключили искусственный интеллект, и результаты оказались впечатляющими...

18.10.2025 12:40
1.9k+

Google обновила Veo до версии 3.1: больше реализма, звука и кинематографичности

Google выпустила обновлённую версию своего ИИ-генератора видео — Veo 3.1. Новая модель отличается более реалистичным изображением, точным следованием текстовым запросам и улучшенным звуковым оформлением. По сравнению с версией, выпущенной в мае, Veo 3...

17.10.2025 00:39
2.4k+

Microsoft представила MAI-Image-1 — собственный ИИ-генератор реалистичных картинок

Компания Microsoft представила собственный генератор изображений на базе искусственного интеллекта — MAI-Image-1. Это первая модель для создания фотореалистичных картинок, полностью разработанная внутри самой корпорации...

16.10.2025 09:35
8k+

Туркменские школьники заняли второе место на соревновании Google

Ученики 12-го класса специализированной средней школы №97 города Ашхабада — Бегенч Аннаразов, Айхан Байрамов и Салых Аннанепесов — заняли второе место на соревновании Google Firebase Studio Championship Central Asia 2025...