Компания xAI Илона Маска представила новый инструмент, который преобразует обычный текст в выразительную речь.
На старте доступны пять голосов: Eve, Ara, Rex, Sal и Leo. Система позволяет управлять эмоциями и интонацией прямо в тексте. Пользователь может добавлять специальные указания — например, паузы, смех или другие элементы.
В тексте можно использовать команды вроде «[пауза]» или «[смех]», а также специальные теги. Например, тег <whisper></whisper> позволяет произнести фразу шёпотом, а <slow></slow> — замедлить речь.
По первым отзывам пользователей, система корректно воспроизводит паузы, смех, вздохи, дыхание, а также изменения громкости, высоты тона и скорости речи без дополнительной настройки.
API сервиса поддерживает технологию WebSocket, что позволяет передавать речь в режиме реального времени. Также предусмотрена работа с различными аудиоформатами, среди которых MP3 и mu-law.