Чи замислювались ви над тим, які медичні інновації очікують людство з урахуванням швидких досягнень у галузі машинного навчання та з настанням нової ери, якої сягнула біологія, коли людство виходить за межі науки та переходить до біологічної інженерії? Пропонуємо адаптований переклад думки Віджея Панде (Vijay Pande) – біомедика, професора хімії, структурної біології та інформатики Стенфордського університету, опублікованої на сайті американського венчурного фонду Andreessen Horowitz.
Примара технічного боргу
Кошмарний сон будь-якого програміста, що іноді перетворюється на страхітливу реальність, – долучитись до виконання проекту чи приєднатись до організації, де вже існує та використовується програмне забезпечення із заплутаною структурою та непродуманою архітектурою, яке створювали з десяток років, так званий «технічний борг». Аби довести його до ладу та забезпечити нормальне функціонування необхідні величезні ресурси часу й безліч коштів. Не думайте, що технічний борг у світі програмістів – це поодиноке явище. Про нього знають всі та кожен: десятки років технічного боргу стали причиною «Проблеми 2000 року» компільованої мови програмування Кобол (COBOL) (також званою «проблема Y2K» або «Y2K-сумісність» – проблема можливої неправильної роботи ПЗ у зв’язку з переходом від 1999 до 2000 року); не один рік з технічним боргом боролась соціальна мережа MySpace, та й сьогодні, як стартапи, так і усталені компанії змушені постійно працювати із застарілими кодами.
І все ж кошмар програміста не можна порівняти з жахіттям у царині біології, адже «технічний борг» цієї науки сягає тисячоліть. Протягом останніх декількох мільярдів років еволюція створює власну версію MVP – мінімального, життєздатного продукту, який рік за роком поставляється «користувачам» і застосовується на практиці, однак ніколи не переробляється. Цей набір даних якимось чином працює, оскільки біологія на всіх рівнях – від молекулярного та нано до макро – характеризується певною «антикрихкістю», властивістю, коли «стійкі елементи протистоять потрясінням і лишаються незмінними». Утім така характеристика біології також створює справжній безлад, і варто розуміти, що безлад – це проблема, яку людству слід вирішити, якщо ми хочемо поліпшувати власні тіла, власний життєвий цикл, власне здоров’я.
Спрощення як результат людських обмежень
По суті біологія завжди була зосереджена на розумінні технічного боргу. Хоча багато біологів насолоджуються величезною складністю поля, вони, на жаль, не розуміють, що складність суттєво обмежується через обмеження людського мозку. Ми навіть не можемо візуалізувати, не кажучи вже зрозуміти, як, наприклад, складна мережа тисяч білків взаємодіє з тисячами релевантних мутацій. Така складність нечувана в системах, побудованих людьми; ми можемо вважати систему із сімома ступенями свободи «матір’ю всіх складних людських систем», але біологія навіть найпростіших організмів перевершує цю систему на безліч порядків.
Людині властиво спрощувати речі, таким чином «долаючи» наші людські обмеження у розумінні та вивченні складності. Просто погляньте на лінійну, ієрархічну концепцію біології, яку ми вивчаємо та використовуємо: молекули в білках, білки в клітинному механізмі, клітинні механізми у клітинах, клітини в тканинах, тканини в органах, органи в організмах, організми в нішах, ніші в екосистемах, екосистеми в планетах, планети в сонячних системах, сонячні системи в галактиках тощо. Ця ієрархія, очевидно, вказує на те, як природа розглядає еволюцію та зміни, а також допомагає людині зрозуміти ті питання, які добре узгоджуються з природними біологічними ієрархіями.
Але що відбувається, коли ми натрапляємо на щось надто складне, занадто нелінійне і занадто взаємопов’язане, щоб вміститися у такі лінійні рамки? Коли сама природа не надає нам ієрархічної структури, її штучне накладання на процеси призводить до надмірного спрощення, що в свою чергу обмежує розуміння природної біологічної складності, на якій ці процеси ґрунтуються. І це, у свою чергу, обмежує можливості того, як ми можемо використовувати біологію для кращого життя. Ми створили такий величезний технічний борг, що втратили переваги та можливості розуміння складності основоположного коду. Додайте до цього ще й все те, що ми спрощуємо, оскільки взагалі не розуміємо, або, що ще гірше, не знаємо, що не знаємо. Оскільки ми не розуміємо причинно-наслідкові зв’язки, ми можемо стверджувати, що рак молочної залози виникає через мутацію гену BRCA. Але чи всі мутації BRCA є онкогенними, тобто призводять до виникнення ракових пухлин? Адже часто у відповідь на шкідливі мутації виникають компенсаторні мутації в інших білках, щоб збалансувати шкідливі наслідки. Навіть стара добревідома центральна догма біології про ланцюжок перенесення генетичної інформації «ДНК -> РНК -> білки» сьогодні сприймається як значно складніша, оскільки стало зрозуміло, що ДНК, РНК і білки взаємодіють між собою нелінійними способами.
Порівняйте таку зміну у розумінні біологічних процесів з переходом від аналогових пристроїв до цифрових, і усвідомте, що тепер ми можемо мати не тільки більш чітке уявлення про те, що відбувається (особливо якщо мова йде про хвороби), але також маємо можливість застосувати машинне навчання в біології. Приміром, в геноміці геном схожий на сітку пікселів у вимірі 1-D. А що трапиться, коли ми поглянемо на нього не з одного виміру, а з декількох?
Машинне навчання й штучний інтелект
За визначенням машинне навчання справляється з тією самою складністю, з якою не може впоратись наш людський розум. Звісно, комп’ютер може здійснювати складні розрахунки за межами можливостей людини, але йдеться не про швидкість і точність, мова про те, що комп’ютери вже вчаться й розуміють.
Машинне навчання у найпростішій формі можна описати як форму регресії або алгоритм підбору кривої, коли комп’ютер отримує навчальні дані, а потім на основі цього створює передбачувану математичну модель. Навіть коли регресії стають дедалі складнішими (з нелінійними функціями, кількома параметрами тощо), людині все одно треба спочатку зрозуміти, що є ключовими змінними (або функціональними можливостями в машинному навчанні), аби комп’ютер зміг побудувати прогностичну модель з їх використанням. Якщо людина не визначить ці функціональні можливості, комп’ютер не буде здатним досягти мети навіть з нескінченною кількістю даних. А що станеться, коли комп’ютер більше не потребуватиме такої допомоги людини? Оскільки галузі штучного інтелекту, глибинного навчання та машинного навчання неухильно розвивались протягом останніх декількох десятиліть, ми, можливо, нарешті дожили до днів переходу від фантастичних розрахунків до фактичного інтелекту. Нові алгоритми можуть визначати й виводити основні функціональні можливості безпосередньо з даних, іноді навіть ґрунтуючись на дуже обмежених даних, таким чином, поглиблюючи наше розуміння та виводячи його на нові рівні. Такий штучний інтелект може визначити відповідні ступені свободи у побудові моделей та включити багато розрізнених ознак, уникаючи ризику надмірної апроксимації. Система може використовувати принцип логіки, званий «Лезо Оккама», чи принцип простоти, згідно з яким не треба робити більше припущень, ніж мінімально потрібно, і таким чином уникнути хибних висновків. Саме у таких випадках машинне навчання дійсно стає штучним інтелектом і стає глибинним навчанням. Глибинне навчання вже змінило багато областей, приміром, розпізнавання зображень, що стало ключем до зміни ефективності лікування. Розвиток цієї галузі вже вплинув на рентгенологію, діагностику, виявлення раку тощо, часто конкуруючи з вміннями людини та потенційно перевищуючи їх.
Як всі ці досягнення допомагають розгадати сферу біології та вийти за рамки людського розуму й успадкованого технологічного боргу? Проаналізуймо біомаркери, які визначають наявність деяких захворювань або інших змін в організмі. Оскільки традиційні біомаркери, використовувані в клінічних випробуваннях, базуються на обмеженому людському підході до розуміння людського тіла, рівень їх точності досить низький. Але тепер завдяки машинному навчанню та штучному інтелекту ми можемо визначити нові біомаркери, про які ми навіть не знали раніше, наприклад, маркери процесу старіння. Коли ми можемо вийти за рамки людських здогадок, щоб дійсно розуміти біологію, ми отримуємо набагато більшу силу передбачення. А встановлення більш точних діагнозів призводить до кращої охорони здоров’я. Класичним прикладом є тест на виявлення гену KLK3 для діагностики раку передміхурової залози. Точність цього тесту становить лише близько 50%, що призводить до величезної кількості помилкових позитивних результатів. Утім, спираючись на більш складні риси, підходи глибинного навчання можуть виходити за межі чинних відомих біомаркерів для вивчення простору, наприклад, аналізуючи більш загальну й розширену імунну відповідь організму на виникнення ракових клітин. Спираючись на межі людських досліджень та розуміння, наука не може знати без перевірки, як виглядає така імунна відповідь, а алгоритм глибинного навчання – може. Це саме явище характерне для машинного та глибинного навчання, що застосовується і до інших медичних питань, приміром, хвороб серця.
Ласкаво просимо в нову еру інженерної біології
Вперше технічний борг біології може бути окреслений, зрозумілий та навіть перероблений. І це відбувається у той час, коли картування генів стало відносно недорогим. У поєднанні з досягненнями в області штучного інтелекту (що також обумовлено подібними скороченнями витрат) перед нами відкриваються двері для нових застосувань біології у галузі охорони здоров’я з безпрецедентною точністю.
Ми живемо в новій епосі науки, де емпіризм замінюється інженерією. Що мається на увазі? Подумайте про будь-який міст, великий або малий, який ви бачили: як і всі мости, він – сконструйований інженерами, оскільки людина точно знає, як будувати мости, і як будувати їх добре. Але в багатьох галузях біології ми ще не знаємо, як будувати речі, тому замість процесу конструювання ми відкриваємо їх емпірично (гіпотеза, тестування, аналіз, висновок). Колись так само будувались мости: в епоху римської імперії деякі експерименти зі зведення мостів не вдавались, деякі – вдавались. Людство вивчало, чому так сталось. І навчилось. Це – емпіризм. Донині ми жили у подібній фазі біології. Фармацевтичний розвиток все ще називають «відкриттям медикаментів», оскільки процес передбачає багато емпіричних випробувань незліченних варіантів, аби побачити, який з них буде працювати, тестувань у лабораторних умовах, на тваринах і людях.
Але з розумінням біологічного коду ці процеси зміняться. Так само, як програмісти вважають за краще починати з нуля, коли йдеться про технічний борг, біологи тепер також можуть створювати все з нуля. Уявіть можливість будувати біологічні схеми зі складністю еволюції, але без технічного боргу. Це вважалося неможливим дотепер, але останні досягнення в області біохімічної інженерії створили безліч білків, що мінімально взаємодіють, які дозволяють новим схемам скористатись корисним клітинним механізмом, не порушуючи його. Наступне завдання, звичайно, це конструювання цих схем у певному напрямі замість їх емпіричного тестування.
Тож якими є практичні та безпосередні наслідки? Приміром, замість класичних дорогих клінічних випробувань фармацевтичні компанії тепер можуть замінити теорію даними. Тим часом, за допомогою цифрових терапій, пацієнти й лікарі можуть досягти не тільки кращої ефективності лікування таких захворювань, як діабет, але і постійно підвищувати цю ефективність. І ми можемо йти ще далі. Вся наша система охорони здоров’я зосереджена на оплаті лікування конкретних показань захворювань; що відбувається, коли ми зосереджуємо увагу не на «що визначити», а на «чому запобігти»? Уявіть, охорона здоров’я може насамперед полягати в тому, щоб зупинити всіх нас від хворобливості та запобігти шкоді, на відміну від сучасної парадигми «не нашкодити». За загальним визнанням, термін «запобігання» нагадує про все те, що ми повинні робити, та всі ті аналізи, які ми повинні здати, але їх точність занадто низька, аби допомогти. Ми можемо зламати ці застарілі бар’єри за допомогою більш точних тестів (і без помилкових результатів).
Ми зараз вступаємо в епоху, де, здавалося б, корисна клятва Гіппократа повинна бути змінена, оскільки зрештою справжня трансформація в галузі охорони здоров’я буде відбуватись з переміщення акценту з «не нашкодити»/«не вбити» на «робити правильно», тобто «запобігти» і «зцілити». Забезпечити здоров’я людини – це не просто лікувати її хвороби (тим більше, що здорові люди, як правило, знаходяться поза межами медичної системи до виникнення захворювання). Ми нарешті готові відійти від моделі або пан або пропав, здійснивши перехід від вдалих здогадок емпіризму до передбачуваної інженерної біології. І жоден з цих процесів не виключає людину, а особливо лікаря, з процесу. Подібно до того, як люди побудували інші інструменти, щоб підштовхнути себе вперед, – рентген, стетоскоп, ЕКГ, смартфон, застосування штучного інтелекту й машинного навчання – це ще один крок до справді сміливого нового світу, де машини допомагають нам стати кращими людьми.
ВАРТО ЧИТАТИ:
Джерело: Andreessen Horowitz, переклад підготувала Ірина Гоял, спеціально для «Блог Imena.UA»