Amazon создала крупнейшую на сегодняшний день ИИ-модель для преобразования текста в речь

19.02.2024 23:58
3k+

Американская технологическая компания Amazon анонсировала прорыв в области ИИ-технологий: BASE TTS (Big Adaptive Streamable TTS with Emergent options), нейросеть, способную преобразовывать текст в речь с беспрецедентной реалистичностью.

Создатели нейросети представили результаты своих наработок на портале научных публикаций arXiv.
Отмечается, что ИИ-модель имеет 980 млн параметров и обучена на 100 тыс. часов записей речи преимущественно на английском языке.
При этом разработчики BASE TTS не ограничились английским. Модель способна правильно произносить слова и фразы на других языках, включая известные выражения, такие как "adios, amigo".
BASE TTS уже прошла тестирование на небольших наборах данных. Результаты показали, что нейросеть способна использовать сложные существительные, выражать эмоции, применять пунктуацию и даже задавать вопросы с акцентом на нужных словах.
В Amazon видят большой потенциал BASE TTS в образовательной сфере. Модель может стать обучающим приложением, помогая людям с дислексией и другими трудностями чтения.

Toyota

Lexus

BMW

Mercedes-Benz

Hyundai

Genesis

Volkswagen

Chevrolet

Mazda

Infiniti

Nissan

Kia

Audi

Jeep

Ford

Mitsubishi

Lada

Opel

Honda

Peugeot

Daewoo

UAZ

Ural

Gaz

Forland

Fekon

Iž

Москвич

Грузовики

Седельные тягачи

Прицепы и полуприцепы

Сельскохозяйственная техника

Строительная техника

Автопогрузчики

Автокраны

Экскаваторы

Бульдозеры

Коммунальная техника

Запчасти

Колёса

Аккумуляторы

Автоинструменты

Аксессуары

Масла и автохимия

Amazon создала крупнейшую на сегодняшний день ИИ-модель для преобразования текста в речь

Нейросеть Claude помогла вернуть доступ к утерянному криптокошельку спустя 11 лет

NASA выступило против проекта Blue Origin Джеффа Безоса с 51 тысячей спутников

ИИ научился выявлять риск СДВГ у детей на ранней стадии

Мэн станет первым штатом США, запретившим строительство крупных дата-центров

Часто посещаемые