Хто використовує ваше обличчя? Неприємна правда про технологію facial-recognition

Коли Джілліан Йорк, 36-річна американська активістка, перебувала у відпустці, вона отримала раптом доволі цікавий лист. Її друг Адам Харві (Adam Harvi), активіст та дослідник, знайшов її фотографії у базі даних уряду США, яка використовувалася для навчання алгоритмів систем розпізнавання облич (Facial recognition system). Адам Харві, запитав її, чи вона про це знає. Йорк, яка працює в Берліні в компанії Electronic Frontier Foundation (EFF, Фонд Електронних рубежів — некомерційна правозахисна організація, заснована з метою захисту закладених в Конституції і Декларації незалежності США прав у зв’язку з появою нових технологій зв’язку). Вона була приголомшена, коли виявила, що база даних містила майже десяток її зображень. Це була суміш фотографій і відеозаписів YouTube, зроблених протягом восьми років.

Коли вона почала виясняти, навіщо потрібна та база даних, то зрозуміла, що зображення її обличчя допомагало створити системи, які потенційно можуть використовуватися федеральним урядом для ідентифікації різних персон. Наприклад, мова йде про підозрюваних злочинців, терористів і нелегальних іноземців.

Перші зображення були датовані 2008 роком, останні — 2015-м. Крім того, дві фотографії були взяті з галереї приватних вечірок у вузькому колі друзів.

Океани персональних даних

Д. Йорк стала однією з 3500 суб’єктів у цій базі даних, яка відома під назвою Iarpa Janus Benchmark-C (IJB-C). Iarpa є органом уряду США, який фінансує інноваційні дослідження, спрямовані на надання конкурентної переваги розвідувальним службам США; Янус — назва римського дволикого бога — є назвою ініціативи по розпізнаванню обличчя.

Загалом набір даних, який був складений урядовим субпідрядником під назвою Noblis, містив в собі в цілому 21294 зображення облич (є також й інші частини тіла), в середньому шість фотографій і три відео на людину, і доступний для дослідників у цій галузі. Відповідно до коментарів Noblis, це сховище інформації складали так, щоб там були люди з різноманітними професіями, а не тільки «знаменитості », які більш-менш відомі для населення планети.

Окрім того, в наборі даних було виявлено скани облич трьох членів правління EFF, журналіста Аль-Джазіра, а також кількох політичних активістів Близького Сходу, включно з єгипетським вченим, який брав участь у протестах на площі Тахрір у 2011 році.

Жоден з описаних вище людей не знав про те, що їхні обличчя потрапили до бази даних, адже ці зображення були завантажені на умовах ліцензії Creative Commons. Це угода про авторське право в інтернеті, що дозволяє копіювати та повторно використовувати зображення для академічних та комерційних цілей.

Головне завдання технології розпізнавання облич — забезпечення безпеки, чи то приватними компаніями, чи то державними органами, наприклад поліцією, прикордонною службою та іншими. Уряди все частіше використовують її для ідентифікації людей з метою забезпечення національної безпеки: для розпізнавання особи під час паспортного контролю, спостереження за натовпом під час масових заходів, інших завдань.

Постановочні фотографії є малоефективними для машинного навчання

Найбільшою технічною перешкодою для досягнення точного розпізнавання облич досі є нездатність машин ідентифікувати людські обличчя, коли вони видимі лише частково, наприклад, знаходяться в тіні або значною мірою закриті одягом. Але ж комп’ютери зазвичай навчаються на фотографіях з високою роздільною здатністю, а це зовсім інша справа, що дуже сильно відрізняється від реальності.

Щоб навчити машину якісно розпізнавати людські обличчя, її треба тренувати на сотнях тисяч облич усіх форм, розмірів, кольорів, віків і статей. Чим природніші зображення, тим краще вони моделюють реальні сценарії, в яких може відбуватися спостереження, і тим точніше отримані моделі для розпізнавання осіб.

Для того, щоб «прогодувати» цю систему, необхідні величезні сховища з зображеннями облич, вручну вибрані з різних джерел, таких як університетські кампуси, міські площі, ринки, кафе, а також з соціальних мереж.

«Ми бачимо, що мета розпізнавання обличчя змінюється, — говорить Дейв Маас, старший дослідник досліджень в EFF. — Спочатку технологію використовували для ідентифікації обличчя. Але тепер вона може використовуватися для відстеження переміщення, тобто система здатна відстежувати, як певний трекінговий номер переміщуються з одного місця на інше, і це кардинальна зміна. До того ж дослідники не платять людям за дозвіл на фотографування, їм не потрібно шукати спеціальних фотомоделей, оскільки вони отримують всі необхідні зображення для тренування системи безкоштовно».

Набір даних, що містить обличчя Джілліан Йорк — це одна з серій, зібраних від імені Iarpa (більш ранні ітерації — IJB-A і -B). Він використовувався такими компаніями як китайська фірма SenseTime, яка продає засоби розпізнавання обличчя китайській поліції, та японська IT-компанія NEC, що постачає програмне забезпечення правоохоронним органам США, Великобританії та Індії.

У Китаї програмне забезпечення для сканування обличчя відіграло значну роль у масовому нагляді з боку уряду і затриманні мусульманських уйгурів у далекому західному регіоні Сіньцзяна. Камери, зроблені компанією Hikvision, однією з найбільших у світі систем відеоспостереження, і Leon, колишнім партнером SenseTime, були використані для відстеження мусульман по всьому Сіньцзяну. Організації, що займаються правами людини, описують це як систематичні репресії мільйонів людей.

На початку цього тижня з’ясувалося, що SenseTime продала свій 51-відсотковий пакет акцій спільного підприємства безпеки з Leon у Сіньцзяні після зростаючого міжнародного протесту щодо репресій уйгурів.

«Це був шок, — зауважила Джілліан Йорк. — Проблема не в тому, що використовується зображення мого обличчя, а в тому, як воно використовується».

Одна з перших масштабних баз даних, що містить зображення облич, була створена Міністерством оборони США в 1990-х роках, вона містила обличчя військовослужбовців, яких фотографували в студіях і яким платили гонорар. Але у 2007 році дослідники почали розуміти, що студійні фотографії занадто нереалістичні для використання в якості навчальних даних, і що системи facial-recognition, побудовані на них, будуть дуже неефективними в реальному світі. Необхідно тренувати систему на зображеннях з реального життя – природних, розмитих, зроблених не в студійних умовах.

Того ж року в Массачусетському університеті було зроблено новий набір даних, під назвою Labeled Faces In The Wild (LFW) – набір зображень, знайдених в новинах в інтернеті. Ці «натуральні» образи містили зображення людей в різних позах і виразах, при різних умовах освітлення, і дослідники зрозуміли, що вони знайшли «золоту жилу»: інтернет. Це було нічим не обмежене джерело різноманітних даних.

Протягом останніх трьох років ринок розпізнавання облич зростав на 20% щорічно. За оцінками Future Market Research, до 2022 року він сягне $9 млрд. Швидкість і точність програмних систем значно поліпшилися завдяки технологіям машинного навчання. Адже тепер комп’ютери можуть навчатися розпізнавати певні об’єкти – скажемо, обличчя — шляхом навчання на великих наборах даних, таких як IJB-C.

Де взяти справді «натуральні» фотознімки?

Та річ у тому, що навіть обличчя, взяті з інтернету, не є насправді повністю «дикими», оскільки люди зазвичай публікують  відредаговані фотографії. Тому розробники почали використовувати фото з камер відеоспостереження. Так, близько 1700 студентів Університету Колорадо були сфотографовані в період з лютого 2012 року по вересень 2013 року за допомогою камери спостереження з високою роздільною здатністю далекого діапазону «без їхнього відома», говорить Террі Боулт (Terry Boult), комп’ютерний вчений в цьому університеті.

Як і Iarpa, лабораторія Boult фінансується з фондів ВМС США. Лабораторія надала результати своїх досліджень по розпізнаванню облич Міністерству внутрішньої безпеки та іншим державним органам. Оскільки Болт знімав учнів у громадському місці (хоча і в університеті), він каже, що дозвіл на знімання не потрібний, оскільки він ідентифікував людей згідно з законом штату Колорадо.

Ще один набір даних з університетських кампусів – Duke-MTMC – був створений в Університеті Дьюка в Північній Кароліні. Фінансований частково дослідницьким офісом армії США, він став одним з найпопулярніших навчальних наборів для розпізнавання пішоходів.

Аналіз по країнам, де академічні кола використовують базу даних Duke MTMC. ЯК бачимо, Китай домінує і цій галузі

Аналіз по країнах, де академічні кола використовують базу даних Duke MTMC. Як бачимо, Китай домінує і цій галузі

Дослідники використали вісім камер, щоб зафільмувати, як студенти ходили по території кампусу. Про те, що ведеться фільмування, вони повідомили через плакати, розміщені по периметру території. Ще в одному випадку відеозаписи клієнтів були зроблені за допомогою камери відеоспостереження у кафе Brainwash у Сан-Франциско.

Експерти відзначають, що технології аналізу облич призначені не тільки для спостереження — вони можуть бути використані й для моніторингу здоров’я. Наприклад, сканування облич здатне визначити, що у людини розвивається деменція або діабет 2-го типу, також технологія дозволяє перевірити сонливість або сп’яніння у водіїв.

Уряд та інтернет-гіганти володіють занадто великими обсягами інформації

Якби набори даних не були спільними, то такі гравці як Facebook та Google, які щодня завантажують на свої сайти мільярди фотографій і відео користувачів, стали б єдиними організаціями, що мають доступ до океану високоякісних особистих даних. Відповідно вони б мали й кращі алгоритми розпізнавання облич, стверджують деякі дослідники.

«Я не переживаю стосовно можливостей уряду, я стурбований з приводу дій Google і Facebook», — говорить Карл Риканек (Karl Ricanek), професор Університету Північної Кароліни Вілмінгтон, який побудував два загальнодоступних набору даних. «На мою думку, вони мають більше інформації про громадян, ніж самі уряди, і ми не можемо ніяк вплинути на це».

Попри те, що комерційні компанії часто володіють власними великими базами даних, вони теж все частіше звертаються до інтернету, щоб відбирати більші «натуральні» набори даних, які використовуються для тестування та навчання алгоритмів. Наприклад, Facebook створив сховище даних під назвою People in Photo Albums, що складається з більш ніж 37 тисяч фотографій 2000 осіб, включаючи дітей, з особистих фотоальбомів Flickr.

«Попри те, що останнім часом було досягнуто значного прогресу у розпізнаванні обличчя анфас, все ж інші ракурси набагато частіше зустрічаються в фотоальбомах, ніж люди можуть підозрювати», — написали дослідники Facebook.

«Ми не співпрацюємо з китайським урядом в галузі розпізнавання обличчя і ніколи не працювали, — сказав представник Facebook.  — Проте завжди стояло питання, чи слід поширювати досягнення в галузі техніки на тісне співробітництво з іншими країнами. Facebook та інші провідні технологічні компанії вважають, що наукова спільнота має обмінюватися досвідом у сфері просування технологій, а також працювати над запобіганням зловживань».

У тих випадках, коли зображення знайдені в інтернеті, дослідники — навіть у великих компаніях, таких як Microsoft, IBM і Facebook — покладалися на ліцензію Creative Commons (СС) для отримання згоди користувача. Але застосування цих фотографій як навчальних даних для спостереження та аналізу обличчя настільки далеке від того, що покривала ліцензія Creative Commons, що організація нещодавно опублікувала заяву для пояснення змін.

«Ліцензії CC були розроблені для розв’язання конкретних питань: розблокування обмежувальних дій авторських прав. Але авторське право не є хорошим інструментом для захисту приватної особистості, для розв’язання питань етики досліджень у розвитку штучного інтелекту або для регулювання використання інструментів спостереження, що використовуються в інтернеті. Ці питання належать до простору державної політики», — написав виконавчий директор Райан Мерклі (Ryan Merkley).

У кінцевому підсумку, експерти вважають, що зараз занадто пізно для того, щоб повернути скани облич «в коробку» або обмежити їх рух через географічні кордони. Навіть якби творці наборів даних намагалися контролювати доступ, немає жодного способу, щоб вони могли зупинити їх надходження в руки ізраїльського, американського або китайського держоргану, або будь-кого, хто намагається тренувати алгоритми розпізнавання облич.

Насправді, розпізнавання обличчя є лише першим кроком біометричного спостереження, вважають експерти. Це дійсно схоже на початковий рівень набагато ширшого та глибшого аналізу біометричних даних людини. Наприклад, є технологія розпізнавання щелепи — ширина вашої щелепи може бути використана для того, щоб зробити висновок про вашу успішність як генерального директора. Такі компанії як Affectiva в Бостоні проводять дослідження по аналізу обличчя в режимі реального часу. Це дозволяє визначити через відеокамеру, чи покупець планує щось купити у вашому магазині.

Інші аналізи можуть бути використані для визначення втомленості, ступеня якості здорової шкіри та частоти серцевих скорочень людей, або навіть для читання по губах того, що говорить людина. Взагалі, експерти вважають, що розпізнавання облич — не дуже точний термін, з технічної точки зору, тому що технологія не обмежується тільки обличчями. Фактично подібні технології можуть обмежитися лише розпізнаванням вашої ДНК.

ЧИТАЙТЕ ТАКОЖ:

Джерело: Medium