Meta представила Llama 4: ИИ говорит на 200 языках и считывает 48 изображений за раз

  • 06.04.2025 22:12
  • 2.1k+

Meta представила новое поколение ИИ-моделей Llama 4, способных обрабатывать текст, изображения и видео. Новые версии Scout и Maverick доступны разработчикам на llama.com и Hugging Face, а в ближайшее время появятся в сервисах Meta AI, включая WhatsApp, Messenger и Instagram.

Главное отличие от предыдущих версий — объединённая обработка текста и изображений. Scout использует 17 млрд активных параметров (из 109 млрд) и может анализировать до 48 изображений одновременно. Модель работает даже на одной видеокарте NVIDIA H100, опережая Google Gemma 3 по скорости. Контекстное окно составляет 10 млн токенов — это эквивалентно 20 часам видео или 5000 страниц текста.


Модель Maverick с 400 млрд параметров (17 млрд активных) заняла 2-е место в рейтинге LMSYS Arena с 1417 баллами ELO. Она оптимизирована для серверов и подходит для генерации кода, логических задач и обработки больших объёмов текста. Для запуска достаточно одной DGX-ноды с 8 GPU H100.
Обе модели обучены на 30 трлн токенов, включающих данные на 200 языках. Безопасность обеспечивают инструменты Llama Guard и Prompt Guard. Частота отказов на спорные темы снижена до 2%. Обучение базовой модели Behemoth с 2 трлн параметров позволило ускорить разработку в 10 раз.
29 апреля на мероприятии LlamaCon корпорация Meta представит ИИ с логическим мышлением.


вчера 20:30
643

Microsoft запустила ИИ-платформу Discovery для ускорения научных исследований

На конференции Build 2025 компания Microsoft представила платформу Discovery, созданную для ускорения научных открытий с помощью искусственного интеллекта. По данным компании, новая система охватывает весь цикл исследований: от анализа данных и формулирования гипотез до моделирования экспериментов и обработки результатов...

вчера 12:30
2.7k+

Google представила Veo 3 — первую ИИ-модель, которая генерирует видео со звуком

Недолгая история немого ИИ-видео подошла к концу. На конференции I/O 2025 Google представила модель Veo 3 — первую версию генеративного ИИ, которая создаёт видео по тексту вместе со звуком. В отличие от других решений, модель не требует дополнительных указаний для создания звуков: она анализирует содержимое кадров и автоматически подбирает звуковое сопровождение...

20.05.2025 10:44
3.1k+

Это уже выглядит странно… ИИ начал сам придумывать правила общения и язык

Модели искусственного интеллекта на основе больших языковых моделей (LLM) способны самостоятельно вырабатывать социальные нормы и языковые правила. К такому выводу пришли исследователи из Университета Сити Сент-Джордж (Лондон) и ИТ-университета Копенгагена...

20.05.2025 07:46
2.5k+

Bloomberg: OpenAI примет участие в создании крупнейшего дата-центра в ОАЭ

Компания OpenAI, разработчик ChatGPT, планирует принять участие в проекте по созданию нового крупного дата-центра в Объединённых Арабских Эмиратах. По данным агентства Bloomberg, дата-центр будет построен в Абу-Даби, его проектируемая мощность составит 5 гигаватт...