Что искусственный интеллект может научить нас о белках

Белки являются жизненно важными частями всех живых организмов и выполняют важные задачи в нашем организме. Они строят и восстанавливают ткани, поставляют компоненты иммунной и гормональной систем, регулируют обмен веществ и передают сигналы. В настоящее время исследователи разработали интеллектуальную нейронную сеть, которая может прогнозировать функции белков в организме человека. Команда использовала «хитрость», чтобы наблюдать, как сеть делает это предсказания. Выводы, полученные в результате этого исследования, могут помочь в поиске новых целевых лекарств.

Интеллектуальные виртуальные спутники, такие как Alexa, Siri и Google Assistant, уже давно стали частью нашей повседневной жизни. А интеллектуальные вычислительные программы, так называемые алгоритмы, также стали неотъемлемым инструментом научных исследований. Огромные объемы данных, полученных в исследованиях в области наук о жизни, могут быть эффективно проанализированы на предмет повторяющихся паттернов с помощью алгоритмов.

Некоторые программы способны обнаруживать повторяющиеся структуры в больших белковых молекулах и затем использовать эту информацию, чтобы сделать выводы о том, какие клеточные задачи выполняют эти молекулы — например, функционируют ли они как генные переключатели, молекулярные двигатели или сигнальные молекулы.

Тем не менее, основным недостатком предыдущих методов является то, что пользователи находятся в полном неведении относительно того, почему алгоритм назначает определенную функцию определенным последовательностям белка. Точные знания компьютера о белках напрямую недоступны, несмотря на то, что такие знания могут оказаться неоценимыми для продвижения исследований и разработок новых агентов.

Студенческая команда, возглавляемая Роландом Эйлсом и Ириной Леманн из Берлинского института здоровья (BIH) и Charité — Universitätsmedizin Berlin, в сотрудничестве с Домиником Ниопеком из Института фармации и молекулярной биотехнологии (IPMB) в Гейдельбергском университете цель разблокировки этих знаний с компьютера.

Он начал работать над этой темой в 2017 году и разработал алгоритм под названием «DeeProtein», всеобъемлющую и интеллектуальную нейронную сеть, которая может прогнозировать функции белков на основе последовательности отдельных строительных блоков белка, аминокислот. Как и большинство алгоритмов обучения, DeeProtein — это «черный ящик», а это означает, что их работа остается загадкой как для программистов, так и для пользователей. Но студенты теперь использовали «хитрость», чтобы разгадать секрет этой сети.

Молодые ученые начали с того, что разработали способ образно взглянуть через плечо программы во время ее работы. «В анализе чувствительности мы последовательно маскируем каждую позицию в последовательности белка и позволяем DeeProtein вычислить или, скорее, предсказать функцию белка на основе этой неполной информации», — объясняет Юлиус Апмейер из Белзена. Он учится в магистратуре по молекулярной биотехнологии в IPMB и является ведущим автором статьи, которая была только что опубликована в журнале Nature Machine Intelligence.

«Затем мы даем DeeProtein полную информацию о последовательности и сравниваем два набора прогнозов», — добавляет Upmeier zu Belzen. «Таким образом, мы рассчитываем для каждой позиции в последовательности белка, насколько важна эта позиция для предсказания правильной функции. Это означает, что мы даем каждой позиции или аминокислоте в цепочке белка значение чувствительности для функции белка».

Затем ученые используют новую аналитическую технику для определения областей белков, жизненно важных для их функции. Этот метод работает для передачи сигналов белков, которые играют роль во время канцерогенеза, а также для инструмента редактирования генов CRISPR-Cas9, который уже был протестирован в большом количестве доклинических и клинических исследований. «Анализ чувствительности позволяет нам идентифицировать участки белка, которые хорошо или плохо переносят изменения», — говорит Доминик Ниопек. «Это важный первый шаг, если мы хотим внести целенаправленные изменения в белки, чтобы оснастить их новыми функциями или« отключить »нежелательные свойства».

«С помощью этой работы мы показываем, что предсказания нейронных сетей могут быть не только полезными, но и впервые мы можем использовать эти неявные знания для практических целей», — объясняет Роланд Эйлс. Этот подход актуален для многих вопросов молекулярной биологии и медицины. «Если, например, мы хотим разработать целевые препараты или генную терапию, нам нужно точно знать, на чем нужно сосредоточить внимание», — добавляет Эйлс. «DeeProtein теперь может помочь нам сделать это».