На конференции Cloud Next компания Google представила свой самый мощный ИИ-процессор Ironwood. Новый чип предназначен для работы с уже обученными ИИ-моделями и будет применяться в инфраструктуре Google Cloud.
Это седьмое поколение TPU и первый чип компании, специально оптимизированный для инференса — выполнения уже обученных ИИ-моделей.
Процессор будет применяться в облачной инфраструктуре Google Cloud. Он будет доступен в виде серверов с 256 чипами и кластеров из 9216 чипов.
«Ironwood — это наш самый мощный, самый производительный и самый энергоэффективный TPU. Он разработан для ускорения инференса ИИ-моделей в масштабах облачной инфраструктуры», — заявил вице-президент Google Cloud Амин Вахдат.
Ironwood обеспечивает производительность до 4614 терафлопс. Кластер из 9216 таких процессоров достигнет 42,5 экзафлопс.
Каждый чип оснащён 192 Гбайт оперативной памяти с пропускной способностью 7,4 Тбит/с. В нём также используется ядро SparseCore для работы с рекомендательными системами и алгоритмами ранжирования.
Компания планирует интегрировать Ironwood в модульный кластер AI Hypercomputer внутри Google Cloud.