Google представила TranslateGemma — семейство открытых ИИ-моделей для локального перевода на 55 языков. Разработка предназначена для работы на мобильных устройствах, ноутбуках и облачных серверах без обязательного подключения к интернету.
В линейку вошли три версии модели. Вариант с 4 млрд параметров оптимизирован для смартфонов и портативных устройств. Модель с 12 млрд параметров рассчитана на потребительские ноутбуки. Версия с 27 млрд параметров предназначена для облачных серверов и может работать на одном графическом ускорителе H100 или тензорном процессоре.
Тестирование на платформе MetricX показало снижение количества ошибок по сравнению с базовыми моделями Gemma 3. TranslateGemma с 12 млрд параметров набрала 3,6 балла, тогда как Gemma 3 с 27 млрд параметров — 4,04 балла. По сравнению с моделью Gemma 3 на 12 млрд параметров уровень ошибок снизился примерно на 26 %.

Улучшения зафиксированы по всем 55 языковым парам. Так, к примеру, ошибки при переводе с английского на исландский сократились на 30 %, на суахили — на 25 %.
Модели обучались в два этапа с использованием параллельных данных и обучения с подкреплением. Около 30 % обучающей выборки составили общие данные, что позволяет использовать TranslateGemma и в формате чат-ботов. Все модели сохранили мультимодальные возможности и могут переводить текст с изображений. TranslateGemma доступна на платформах Kaggle и Hugging Face.
