Ученые НИУ ВШЭ разработали модель GSMFormer-PPI, которая с точностью до 95% предсказывает, будут ли белки взаимодействовать друг с другом. Разработка может помочь в изучении механизмов заболеваний и поиске мишеней для лекарств.
Почти все процессы в клетке зависят от взаимодействия белков. Они участвуют в передаче сигналов, регулируют химические реакции и формируют молекулярные комплексы. Нарушения в этих процессах могут приводить к болезням.
Новая модель учитывает три типа данных о белках: аминокислотную последовательность, трехмерную структуру и свойства поверхности. Эти данные преобразуются в числовой вид и анализируются с помощью нейросети, которая выявляет связи между ними.
«При взаимодействии белков особенно важна их поверхность: именно через нее молекулы распознают друг друга и на ней сосредоточены физико-химические свойства, от которых зависит связывание. В нашей модели мы попытались учесть эту информацию вместе с последовательностью и трехмерной структурой белка, а затем не просто объединить признаки, а дать алгоритму возможность анализировать связи между ними. Именно это и позволило точнее предсказывать белок-белковые взаимодействия», — комментирует директор Центра биомедицинских исследований и технологий Института искусственного интеллекта и цифровых наук НИУ ВШЭ Мария Попцова.
Модель протестировали на базе данных PINDER. В результате она показала точность 95,7% и превзошла ряд существующих решений.
Результаты исследования опубликованы в журнале Scientific Reports.