Amazon создала крупнейшую на сегодняшний день ИИ-модель для преобразования текста в речь

  • 19.02.2024 23:58
  • 2.8k+

Американская технологическая компания Amazon анонсировала прорыв в области ИИ-технологий: BASE TTS (Big Adaptive Streamable TTS with Emergent options), нейросеть, способную преобразовывать текст в речь с беспрецедентной реалистичностью.

Создатели нейросети представили результаты своих наработок на портале научных публикаций arXiv.
Отмечается, что ИИ-модель имеет 980 млн параметров и обучена на 100 тыс. часов записей речи преимущественно на английском языке.
При этом разработчики BASE TTS не ограничились английским. Модель способна правильно произносить слова и фразы на других языках, включая известные выражения, такие как "adios, amigo".
BASE TTS уже прошла тестирование на небольших наборах данных. Результаты показали, что нейросеть способна использовать сложные существительные, выражать эмоции, применять пунктуацию и даже задавать вопросы с акцентом на нужных словах.
В Amazon видят большой потенциал BASE TTS в образовательной сфере. Модель может стать обучающим приложением, помогая людям с дислексией и другими трудностями чтения.


25.06.2025 10:59
3.9k+

Маск заявил, что новая версия Grok получит «все знания человечества»

Илон Маск заявил, что новая версия искусственного интеллекта Grok должна вобрать в себя «все человеческие знания». Об этом он написал в социальной сети X, отметив, что его ИИ будет отличаться от решений конкурентов благодаря другим исходным данным для обучения...

25.06.2025 10:13
3.2k+

В России создали технологию, которая поможет отличать дипфейк от реального контента

Институт системного программирования РАН разработал систему, способную автоматически помечать контент, созданный с помощью искусственного интеллекта. Об этом сообщает РИА Новости. Технология использует цифровые метки, незаметные для человека, но легко распознаваемые компьютером...

23.06.2025 12:49
3.2k+

Исследование MIT: зависимость от ChatGPT снижает активность мозга и креативность

Ученые Массачусетского технологического института (MIT) выяснили, что чрезмерная зависимость от использования ChatGPT при работе с текстами может снижать обучаемость и критическое мышление. Об этом сообщает журнал Time со ссылкой на новое исследование...

21.06.2025 17:17
1.4k+

Midjourney представила свою первую модель для генерации видео – V1

Midjourney, одна из ведущих компаний в сфере генеративного искусственного интеллекта, представила свою первую модель для создания видео — V1. Новая модель позволяет превращать любое изображение, созданное в нейросети или загруженное пользователем, в короткий видеоролик...