Британская компания Basecamp Research объявила о запуске проекта Trillion Gene Atlas, который предполагает сбор и анализ генетических данных более чем от 100 миллионов ранее не изученных видов живых организмов.
По заявлению участников инициативы, проект позволит увеличить объем известных генетических данных примерно в сто раз. Он реализуется совместно с компаниями Anthropic, Ultima Genomics, PacBio и при поддержке вычислительной инфраструктуры Nvidia.
Разработчики рассчитывают завершить работу менее чем за два года благодаря сочетанию современных технологий секвенирования и искусственного интеллекта. Основная цель проекта — создание новой базы данных для обучения биологических ИИ-моделей.
В компании сообщили, что уже располагают базой более чем из 10 миллиардов ранее неизвестных генов, обнаруженных примерно у миллиона новых видов. Полученные данные используются для обучения моделей семейства EDEN, предназначенных для разработки терапевтических молекул и других биотехнологических решений.
Авторы проекта сравнивают проект по масштабу с программой «Геном человека», однако теперь речь идет не об одном виде, а о создании крупнейшей в истории карты генетического разнообразия Земли.