Amazon создала крупнейшую на сегодняшний день ИИ-модель для преобразования текста в речь

  • 19.02.2024 23:58
  • 2.8k+

Американская технологическая компания Amazon анонсировала прорыв в области ИИ-технологий: BASE TTS (Big Adaptive Streamable TTS with Emergent options), нейросеть, способную преобразовывать текст в речь с беспрецедентной реалистичностью.

Создатели нейросети представили результаты своих наработок на портале научных публикаций arXiv.
Отмечается, что ИИ-модель имеет 980 млн параметров и обучена на 100 тыс. часов записей речи преимущественно на английском языке.
При этом разработчики BASE TTS не ограничились английским. Модель способна правильно произносить слова и фразы на других языках, включая известные выражения, такие как "adios, amigo".
BASE TTS уже прошла тестирование на небольших наборах данных. Результаты показали, что нейросеть способна использовать сложные существительные, выражать эмоции, применять пунктуацию и даже задавать вопросы с акцентом на нужных словах.
В Amazon видят большой потенциал BASE TTS в образовательной сфере. Модель может стать обучающим приложением, помогая людям с дислексией и другими трудностями чтения.


25.05.2025 19:41
1.2k+

Google создала инструмент для проверки ИИ-контента

На конференции Google I/O 2025 компания представила SynthID Detector — специальный портал для проверки цифрового контента, созданного с помощью искусственного интеллекта. SynthID Detector позволяет определить, был ли загруженный файл создан с использованием ИИ-инструментов Google...

23.05.2025 19:17
3.5k+

Японские ученые научили ИИ выявлять тромбы до их образования

Учёные Токийского университета представили метод, позволяющий в режиме реального времени отслеживать образование тромбов в крови без сложных анализов. Разработка основана на комбинации микроскопа нового поколения и алгоритмов искусственного интеллекта...

20.05.2025 07:41
1.1k+

Autonomous представила миниатюрный дата-центр для локального запуска ИИ-моделей

Компания Autonomous Inc. выпустила новую рабочую станцию Brainy — компактное и мощное устройство для локального запуска и обучения ИИ-моделей без облака. В отличие от обычных ПК, Brainy способен поддерживать до восьми видеокарт RTX 4090 и обеспечивает производительность свыше петафлопса...

18.05.2025 21:56
2.8k+

В Гарварде искусственный интеллект применяют в поиске инопланетян

Гарвардский университет использует искусственный интеллект в рамках проекта «Галилео» для поиска признаков внеземной жизни. Об этом пишет Bloomberg. Таким проектом руководит доктор Лора Домине. Ранее она занималась нейтрино — элементарными частицами, которые почти невозможно зафиксировать...