Meta представила Llama 4: ИИ говорит на 200 языках и считывает 48 изображений за раз

  • 06.04.2025 22:12
  • 2.1k+

Meta представила новое поколение ИИ-моделей Llama 4, способных обрабатывать текст, изображения и видео. Новые версии Scout и Maverick доступны разработчикам на llama.com и Hugging Face, а в ближайшее время появятся в сервисах Meta AI, включая WhatsApp, Messenger и Instagram.

Главное отличие от предыдущих версий — объединённая обработка текста и изображений. Scout использует 17 млрд активных параметров (из 109 млрд) и может анализировать до 48 изображений одновременно. Модель работает даже на одной видеокарте NVIDIA H100, опережая Google Gemma 3 по скорости. Контекстное окно составляет 10 млн токенов — это эквивалентно 20 часам видео или 5000 страниц текста.


Модель Maverick с 400 млрд параметров (17 млрд активных) заняла 2-е место в рейтинге LMSYS Arena с 1417 баллами ELO. Она оптимизирована для серверов и подходит для генерации кода, логических задач и обработки больших объёмов текста. Для запуска достаточно одной DGX-ноды с 8 GPU H100.
Обе модели обучены на 30 трлн токенов, включающих данные на 200 языках. Безопасность обеспечивают инструменты Llama Guard и Prompt Guard. Частота отказов на спорные темы снижена до 2%. Обучение базовой модели Behemoth с 2 трлн параметров позволило ускорить разработку в 10 раз.
29 апреля на мероприятии LlamaCon корпорация Meta представит ИИ с логическим мышлением.


29.07.2025 11:30
868

В YouTube Shorts появились инструменты для генерации видео из фото и текста

YouTube представил новые инструменты на базе искусственного интеллекта для упрощения создания коротких вертикальных видео Shorts. Об этом сообщается в блоге видеосервиса. Среди нововведений — функция преобразования фотографий в видеоклипы, видеоэффекты с ИИ-анимацией, а также редактор AI Playground, который позволяет генерировать видео, изображения и музыку на основе текстовых подсказок...

27.07.2025 20:19
2.6k+

Google DeepMind обучила ИИ восстанавливать утраченные части латинских надписей

Компания Google DeepMind создала открытую нейросеть Aeneas, способную восстанавливать утраченные фрагменты древних латинских надписей. Информация опубликована на официальном сайте проекта. Разработка ориентирована на помощь историкам и эпиграфистам в интерпретации поврежденных памятников римской письменности...

26.07.2025 18:21
2.8k+

В ChatGPT появится режим для помощи в учёбе и подготовки к экзаменам

В веб-приложении ChatGPT анонсирована новая функция под названием «Совместное обучение» (Study Together), которая будет доступна пользователям в ближайшее время. Информация об этом размещена в разделе «Учись и изучай»...

24.07.2025 17:59
8.5k+

Написанный роботом портрет Карла III показали на саммите ООН в Женеве

На саммите AI For Good в штаб-квартире ООН в Женеве представили портрет короля Карл III, созданный человекоподобным роботом Ai-Da. Об этом сообщает Sky News. Картина, названная Algorithm King, выполнена маслом на основе изображений, полученных с камер, встроенных в «глаза» робота...