Як біотехнологічні лабораторії використовують штучний інтелект щоб створити нові ліки

Бурхливий розвиток моделей штучного інтелекту, здатних генерувати практично будь-які зображення, торкнувся різних творчих індустрій, від моди до кіновиробництва. Технологія проникла і в біотех: науковці звертаються до алгоритмів, щоб створювати нові типи білків із заданими параметрами. І хоча це лише перший крок до виробництва ліків з унікальними властивостями, науковці вже називають його технологічною революцією.

Нещодавно відразу дві лабораторії незалежно одна від одної представили програми на базі дифузійних моделей, що дозволяють створювати нові білки, значно підвищуючи точність результату.

Програма Chroma, розроблена бостонським стартапом Generate Biomedicines, описується як DALL-E 2 для біології. Аналогічний проєкт команди з Вашингтонського університету на чолі з біологом Девідом Бейкером отримав назву RoseTTAFold Diffusion. Згідно з опублікованим препринтом, модель генерує точні конструкції білків, які можна повторити у лабораторії.

«Ми створюємо білки, які не мають нічого спільного з тими, що вже існують», – говорить Брайан Тріпп, один із співавторів RoseTTAFold.

Модель дозволяє налаштовувати параметри для отримання різних форм, розмірів, функцій та інших характеристик, по суті, створюючи білки на вимогу, для різних завдань. Науковці сподіваються, що з часом це дозволить винаходити нові та ефективніші ліки.

«За лічені хвилини ми можемо виявити те, на що в еволюції пішли мільйони років», – стверджує Геворг Григорян, CTO Generate Biomedicines.

Білки – базові будівельні блоки живих систем. У тварин вони перетравлюють їжу, скорочують м’язи, уловлюють світло, керують імунною системою та виконують безліч інших функцій. Білки підключаються і в тому випадку, коли людина хворіє.

Симетричні білкові структури, створені Chroma

Тому їх обирають як основну мету для ліків. Щобільше, більшість нових препаратів мають білкову основу.

«Природа використовує білки практично для всього. Перспективи, які вони пропонують для терапії, дуже значні», — каже Григорян.

Але зараз розробники ліків змушені використовувати лише природні білки, і вчені намагаються розширити список інгредієнтів за допомогою нескінченної кількості варіантів, створених комп’ютером.

Обчислювальні методи використовуються для конструювання білків. Але раніше підходи були повільними та важко справлялися з великими білками чи білковими комплексами — молекулярними машинами, створеними з безлічі білків, з’єднаних разом. А такі білки мають вирішальне значення для лікування захворювань.

Структура білка, згенерована RoseTTAFold Diffusion (ліворуч), та сама структура, відтворена в лабораторії (праворуч)

Втім, і представлені програми не перший випадок застосування дифузійних моделей для генерації білка. За останні місяці кілька досліджень продемонстрували перспективи цих моделей. Однак це були лише прототипи, що підтверджують концепцію.

Chroma та RoseTTAFold Diffusion є першими повноцінними програмами, які можуть створювати точні конструкції для широкого спектра білків.

Намрат Ананд, співавтор однієї з перших дифузійних моделей для генерації білка, вважає, що значущість Chroma і RoseTTAFold полягає в тому, що вони використовували метод і вдосконалили його, навчивши на більшій кількості даних і кількості машин. «Виходячи з того, як вони масштабували технологію, буде справедливо порівняти це з DALL-E», — каже вона.

Дифузійні моделі — це нейронні мережі, навчені видаляти з вхідних даних «шум» — випадкові спотворення, що додаються до даних. Якщо ввести в таку модель випадкові пікселі, вона спробує перетворити їх на пізнаване зображення.

Chroma шум додається внаслідок розплутування амінокислотних ланцюжків, з яких складається білок. Отримавши випадкове скупчення цих ланцюжків, Chroma намагається поєднати їх разом, щоб сформувати білок. Керуючись заданими вимогами до результату, Chroma може генерувати нові білки зі специфічними властивостями.

Команда Бейкера дотримується іншого підходу, але отримує подібні результати. Їхня модель починає роботу з ще більш заплутаної структури. Ще одна ключова відмінність у тому, що RoseTTAFold застосовує інформацію про поєднання частин білка, надану окремою нейромережею, навченою прогнозувати структуру білка (як це робить нейромережа AlphaFold, створена DeepMind). І це визначає весь процес.

Білкова структура, створена за допомогою RoseTTAFold Diffusion, яка зв’язується зі спайковим білком SARS-CoV-2

Обидві команди продемонстрували дивовижні результати. Вони здатні створювати білки різного ступеня симетричності, у тому числі круглі, трикутні та шестикутні. Щоб продемонструвати універсальність своєї програми, команда Generate Biomedicines розробила білки у формі 26 літер латинського алфавіту та чисел від 0 до 10.

Також вони можуть генерувати фрагменти білків, зіставляючи нові частини з наявними структурами. Більшість із них на практиці виявляться марними. Але оскільки функція білка визначається його формою, можливість створювати різні структури неймовірно важлива.

Втім, одна річ — розробляти незвичайні конструкції на комп’ютері, і зовсім інша — перетворювати їх на реальні білки. Щоб перевірити, чи можна реалізувати проєкти Chroma, Generate Biomedicines взяла деякі послідовності — амінокислотні ланцюжки, з яких складаються білки, — і прогнала через іншу програму засновану на штучному інтелекті.

Прогноз показав, що 55% з них згортатимуться до структури, запропонованої Chroma, з чого випливає, що конструкції життєздатні.

Подібний тест провела команда Бейкера. Однак вони пішли далі та створили деякі з проєктів RoseTTAFold Diffusion у своїй лабораторії. Generate Biomedicines стверджує, що також проводить лабораторні тести, але поки що не готова оприлюднити результати.

«Це більше, ніж просто доказ концепції. Ми по-справжньому використовуємо метод, щоб створювати якісні білки», — каже Тріппе.

Для Бейкера головним досягненням стало створення нового білка, який приєднується до паратиреоїдного гормону, що контролює рівень кальцію у крові.

«По суті, ми дали моделі гормон і нічого більше і сказали їй виробляти білок, який зв’язується з ним», — пояснює він.

Коли вони протестували результат у лабораторії, то виявили, що він зв’язується з гормоном міцніше, ніж будь-що, що можна було створити за допомогою інших обчислювальних методів. І цей зв’язок був міцнішим, ніж у наявних ліків.

Григорян визнає, що винахід нових білків — лише перший крок із багатьох.

«Ми — фармацевтична компанія… Зрештою важливо, чи зможемо ми виготовляти ліки, які працюють, чи ні», — каже він.

Препарати на основі білка необхідно виготовляти у великих кількостях, потім тестувати у лабораторії та, нарешті, на людях. На це можуть піти роки. Але він припускає, що його компанія та інші знайдуть способи прискорити ці кроки.

«Темпи наукового прогресу нерівномірні, — вважає Бейкер. — Але ж прямо зараз ми знаходимося на етапі, який можна назвати технологічною революцією».

БІЛЬШЕ ЦІКАВОГО:

Джерело: MIT TechnologyReview

Читайте также:

Штучний інтелект в сфері освіти: як використовувати нейромережі вчителям

Звіт State of AI 2024: головні тренди та гравці в галузі штучного інтелекту

Британська поліція тестує детектива на базі штучного інтелекту

Google DeepMind навчила робота грати в настільний теніс на рівні людини