Компания Meta представила новую версию своей большой языковой модели (LLM) Llama 3.1, включающую 405 миллиардов параметров. Согласно заявлению гендиректора Meta Марка Цукерберга, модель Llama 3.1 превосходит по ряду показателей аналогичные модели от OpenAI (GPT-4o) и Anthropic (Claude 3.5).
Новая модель, доступная с открытым исходным кодом, обучена на 16 000 графических процессорах Nvidia H100. Meta утверждает, что Llama 3.1 405B является первой общедоступной моделью, способной конкурировать с закрытыми продуктами в области общих знаний, математических навыков и перевода на несколько языков.
Помимо большой модели, Meta также представила обновления для моделей Llama с 70 млрд и 8 млрд параметров, которые, по утверждению компании, также превосходят своих конкурентов.
В отличие от OpenAI, Google, Microsoft и Anthropic, которые сохраняют свои модели ИИ в собственности, Meta предлагает Llama с открытым исходным кодом. Цукерберг считает, что такой подход обеспечивает более широкий доступ к преимуществам технологии, предотвращает концентрацию власти в руках нескольких крупных компаний и способствует более безопасному развертыванию ИИ.
Llama 3.1 доступна для загрузки с официального сайта модели, а также у партнеров Meta, включая AWS, Nvidia, Databricks, Groq, Dell, Azure и Google Cloud. Пользователи могут протестировать ИИ в чат-боте Meta AI, а в некоторых странах – в Facebook, Instagram и WhatsApp.