Илон Маск заявил, что человечество исчерпало объем знаний, доступных для обучения искусственного интеллекта, пишет TechCrunch.
«Мы исчерпали практически весь накопленный объём человеческих знаний для обучения ИИ. Это произошло фактически в прошлом году», — сообщил он во время стрима с председателем Stagwell Марком Пенном на платформе X.
Миллиардер подтвердил утверждения бывшего главного научного сотрудника OpenAI Ильи Суцкевера, который на конференции NeurIPS отметил наступление «пика данных» и необходимость новых подходов к разработке моделей.
Маск предложил для дальнейшего развития технологий использовать синтетические данные, то есть данные, генерируемые уже самими ИИ-моделями.
«Единственный способ дополнить реальные данные — это синтетические данные, где ИИ сам создаёт обучающие материалы. С синтетическими данными ИИ будет оценивать себя сам и проходить через процесс самообучения», — отметил он.
Синтетические данные уже применяются крупными компаниями, такими как Microsoft, Meta, OpenAI и Anthropic. По данным Gartner, 60% данных, использованных для проектов в области ИИ и аналитики в 2024 году, были сгенерированы синтетически.
Обучение на синтетических данных имеет ряд преимуществ, но прежде всего – оно дешевле. Однако исследования указывают на риск «коллапса модели», когда ИИ теряет креативность и усиливает предвзятость. Это ставит перед индустрией вызовы, связанные с качеством и разнообразием генерируемых данных.