Усі брешуть: як пошукові запити в Google розкривають наші секрети

Усі люди брешуть. Брешуть про те, скільки келихів випили дорогою додому, про те, як часто ходять у тренажерний зал, про те, скільки коштує нова пара взуття… Люди прикидаються хворими, коли насправді здорові. Говорять, що передзвонять, навіть не збираючись робити цього. Стверджують, що щасливі, почуваючись кепсько. Удають, що цікавляться жінками, коли насправді надають перевагу чоловікам.

truth

Люди брешуть усім, навіть самим собі. І, звісно, обманюють під час опитувань, «недоговорюючи» про вчинки та думки, яких соромляться. Вони хочуть виглядати добре, хоча більшість опитувань є анонімними. Це явище називається «упередженням соціальної бажаності». Важливе дослідження у 1950 році засвідчило, як опитування можуть стати жертвою такого упередження. Дослідники зібрали дані про мешканців Денвера, США, з офіційних джерел: який відсоток жителів міста голосував на виборах, займався благодійністю та користувався бібліотечною карткою. Потім вони опитали мешканців, щоб побачити, чи співпадають отримані результати — і були шоковані. Те, що жителі повідомили під час опитування, дуже відрізнялося від даних, зібраних дослідниками. Незважаючи на те, що опитування було анонімним, люди суттєво перебільшували свою участь у голосуванні та благодійності.

Чи змінилося щось через 65 років? Американський дослідник даних Сет Стівенс-Давідовіц (Seth Stephens-Davidowitz) присвятив останні чотири роки аналізу анонімних даних пошуку за допомогою Google. Результатом роботи стала книга «Усі брешуть: що Інтернет може розповісти нам про те, ким ми є насправді» (Everybody Lies: What the Internet Can Tell Us About Who We Really Are), витяги з якої пропонуємо дослідити у статті The Guardian.

Статистика брехні

В епоху інтернету вже не соромно не мати бібліотечної картки. Хоча змінилися прояви поведінки, якої люди соромляться, тенденція обманювати опитувальників залишається такою ж сильною. У ході нещодавнього анкетування випускникам Університету штату Меріленд поставили різноманітні питання про навчання. Відповіді порівняли з офіційними даними. Люди постійно надавали неправильну інформацію, щоб виглядати краще. Менше 2% повідомили, що їх середній бал був нижчим за 2,5, хоча насправді таких людей налічувалося 11%. 44% опитаних заявили, що зробили благодійний внесок до університету в минулому році. Насправді це зробило близько 28%.

А ще ми маємо дивну звичку брехати самим собі. Цим можна пояснити, чому так багато людей стверджують, що їх рівень вище середнього. Наскільки великою є ця проблема? Більше 40% інженерів однієї компанії заявили, що належать до ТОП 5%. Більше 90% викладачів коледжу стверджують, що працюють краще пересічного рівня. Чверть старшокласників вважають, що належать до 1% тих, хто прекрасно знаходить спільну мову з іншими людьми. Якщо ви обманюєте себе, ви не можете бути чесними в опитуванні.

Чим більш безособовими є умови опитування, тим чеснішими є люди. Для виявлення правдивих відповідей інтернет-опитування підходять краще, ніж телефонні опитування, які, у свою чергу, є кращими за особисті опитування. Люди відвертіші, коли перебувають на самоті, а не з іншими у кімнаті. Однак, якщо опитування стосується делікатних тем, будь-який метод опитування характеризуватиметься суттєвою кількістю неправдивої інформації. У людей немає стимулу розкривати істину. То як же дізнатись, про що саме думають люди і що роблять? Big Data.

Деякі онлайн-джерела допомагають людям визнати речі, про які вони б не зізналися жодним іншим чином. Візьмемо для прикладу пошуки за допомогою Google. Пам’ятаєте умови, які роблять людей чеснішими. Інтернет? Галочка. Відсутність свідків? Галочка. Відсутність особи, яка перевіряє опитування? Галочка. Потужність даних Google полягає у тому, що люди розповідають гігантській пошуковій системі те, про що не говорять жодній людині. Google був розроблений таким чином, щоб люди могли дізнатися про світ, а не так, щоб аналітики могли дізнатися про людей; але виявляється, що, шукаючи в інтернеті, ми залишаємо досить виразні сліди. На думку Стівенс-Давідовіца вони є найважливішим із створених будь-коли наборів даних про психіку людину.

Правда про секс

Скільки американських чоловіків є геями? Це стандартне питання у дослідженнях сексуальності. Однак, це – одне з найскладніших питань для соціологів. Представницькі опитування сьогодення говорять про 2-3%. Але сексуальні уподобання вже давно перебувають у списку тем, про які люди, як правило, брешуть. Які ж результати на основі Big Data?

По-перше, розглянемо докладніше дані анкетувань. Результати опитувань стверджують, що у толерантних штатах гомосексуалів більше, ніж у консервативних. Наприклад, за даними дослідження Gallup, частка гомосексуального населення майже вдвічі вища у штаті Род-Айленд, ніж у штаті Міссісіпі. Цьому існує два можливі пояснення. По-перше, гомосексуальні чоловіки, народжені у консервативних штатах, можуть переїхати до толерантних штатів. По-друге, гомосексуали у нетолерантному штаті не можуть відкрито заявляти про те, що вони геї. Такі цифри підтверджує і аналіз інформації у мережі Facebook. Близько 2,5% чоловіків-користувачів Facebook, які вказують гендерні інтереси, зазначають, що цікавляться чоловіками.

І Facebook демонструє великі відмінності у кількості геїв у штатах з високим чи низьким рівнем толерантності. Соцмережа також може надати інформацію про те, як люди переміщаються: аналіз рідних міст користувачів свідчить про певну мобільність, наприклад, з Оклахома-Сіті до Сан-Франциско. Оскільки переміщенням не можна пояснити усі відмінності у кількості геїв у різних штатах, ми повертаємося до проблеми замовчування, яку вирішує Google, адже йому безліч людей відкриває правду, навіть не здогадуючись про це. Аналіз пошукових запитів Google і Google AdWords свідчить, що близько 5% чоловіків, які шукають порно онлайн, цікавляться порно чоловіків-геїв. Знову ж, кількість зацікавлених у Міссісіпі менше, ніж у Род-Айленді (4,8% і 5,2% відповідно).

Результат цього дослідження зрозумілий: величезна кількість чоловіків-геїв у Сполучених Штатах, особливо в консервативних, приховує свою справжню орієнтацію. Вони не розкривають своїх сексуальних уподобань у мережі Facebook, не відкриваються під час опитувань, а в багатьох випадках навіть можуть бути одружені на жінках. Виявляється, жінки часто підозрюють, що їх чоловіки – геї. Докази — у запитаннях до Google: «Як дізнатися, що мій чоловік – гей?» У пошуках, пов’язаних зі словами «мій чоловік» слово «гей» зустрічається на 10% частіше, ніж «зрада», у 8 разів частіше, ніж «алкоголік» і у 10 разів частіше, ніж «депресія».

Коли йдеться про секс, люди зберігають багато секретів. Наприклад, про кількість статевих контактів. Американці стверджують, що використовують набагато більше презервативів, ніж їх продають щороку. Це може означати, що вони просто говорять, що частіше використовують презервативи, ніж фактично роблять це. Але є докази того, що люди також перебільшують кількість статевих актів. Близько 11% жінок у віці від 15 до 44 років говорять, що ведуть активне статеве життя, не є вагітними і не використовують контрацепцію. Навіть при відносно консервативних припущеннях про те, скільки разів вони займаються сексом, вчені припускають, що 10% з них щомісяця повинні вагітніти. Але це вже більше, ніж загальна кількість вагітностей в Америці (одна зі 113 жінок дітородного віку). Адже у культурі, одержимій сексом, важко визнати, що сексу у вас не так і багато. Однак, якщо людина шукаєте пораду, вона звертається до Google, який стверджує, що скарг на чоловіка/дружину, який/яка не бажає сексу, у 16 разів більше, ніж скарг на партнера по шлюбу, який не бажає говорити. Серед неодружених пар різниця у 5,5 разів.

Ми не часто говоримо про проблеми із зовнішнім виглядом чоловіків. Дійсно, жінки більше переймаються своєю зовнішністю, але аналіз Google AdWords доводить, що стереотип не такий однобічний: 42% чоловіків цікавляться красою та фітнесом, 33% – втратою ваги, а 39% – косметичною хірургією. Серед усіх пошуків з «як», пов’язаних з грудьми, близько 20% запитують, як позбутися чоловічих грудей.

Правда про ненависть та упередження

Можна вважати прогресом, що сьогодні засуджуються упередження щодо релігійних чи національних питань. Але замовчування таких думок не означає їх відсутність. Типові приклади питань у Google: «Чому чорні грубі?», або «Чому євреї злі?», або «Чому мусульмани терористи?».

Погляньте, що сталося незабаром після масової стрільби у Сан-Бернардіно, штат Каліфорнія, 2 грудня 2015 року. Того ранку озброєні Різдван Фароок (Rizwan Farook) і Ташфен Малік (Tashfeen Malik) вбили 14 людей на зустрічі співробітників Фарука. Після цієї події найрозповсюдженіший пошук у Google в Каліфорнії зі словом «мусульманин» – «убити мусульман», який зустрічався приблизно з такою ж частотою, як «рецепт Мартіні» та «симптоми мігрені». До Сан-Бернардіно пошуки негативного характеру, пов’язані з мусульманством, становили приблизно 20% від усіх пошуків щодо мусульман, а після нападу їх кількість зросла майже у 3 рази.

Інший популярний феномен, вживанню якого можна присвятити окрему книгу, – слово «ніггер». В однині чи множині, щороку це слово шукають онлайн близько 7 млн американців (у реп-піснях майже завжди використовується «нігга» (nigga), а не «ніггер» (nigger), тож мова не йде про тексти пісень). Кількість пошуків зростає кожного разу, коли афроамериканці потрапляють у новини. Расизм в Америці сьогодні – явище досить загадкове. З одного боку, переважна більшість чорношкірих американців вважають, що вони страждають від упереджень, і наводять достатньо доказів дискримінації. З іншого боку, дуже мало білих американців визнають себе расистами. Останнім часом домінуючим поясненням серед політологів стала так звана теорія «неявної упередженості», згідно з якою білошкірі американці свідомо налаштовані позитивно, але мають підсвідоме упередження, яке впливає на їх ставлення до чорношкірих американців. І академіки винайшли геніальний спосіб перевірити свою теорію – за допомогою тесту «прихованих асоціацій», результати якого свідчать, що людям необхідно більше часу на те, аби пов’язати чорношкірі обличчя з позитивними словами, наприклад, «добре», ніж з негативними словами, наприклад, «зле». Для білошкірих облич тенденція зворотня: більше часу витрачається на негативну асоціацію. Додатковий час, говорять учені, є доказом прихованого упередження, про яке людина може навіть і не знати.

Існує, однак, й альтернативне пояснення дискримінації: невиражений явний расизм. Дані аналізу пошуків у Google підтверджують, що існує досить широко поширений свідомий расизм, про який люди дуже добре знають, але про існування якого не зізнаються. Немає нічого прихованого у пошуку «жартів про ніггерів». І важко уявити, що американці вводять слово «ніггер» у Google з такою ж частотою, як «мігрень» або «економіст», без явного расизму, що має серйозний вплив на афроамериканців. Існування цих даних пояснює безліч явищ сучасної культури, навіть феномен успіху кандидатури Дональда Трампа (Donald Trump) на виборах. Коли Нейт Сілвер (Nate Silver), гуру виборчих технологій, шукав географічну перемінну, котра найбільше співвідноситься з підтримкою Трампа серед республіканців, він знайшов її на мапі расизму, розробленої на основі аналізу даних пошуку Google.

Правда про дівчат

Видається, що в основі дискримінації чорношкірих людей у США все ж лежить невиражена явна ворожнеча. Але для інших груп підсвідомі упередження можуть мати більш фундаментальний вплив. Наприклад, завдяки пошукам у Google Стівенс-Давідовіц знайшов докази прихованого упередження щодо іншого сегмента населення – дівчат. І як ви гадаєте, хто має приховані упередження щодо них? Батьки.

Нікого не дивує, що батьки часто переймаються тим, чи їх діти обдаровані. Фактично усі пошуки у Google, які починаються словами «Чи моя дворічна дитина…», закінчуються словом «обдарований». Але це питання у два з половиною рази частіше стосується хлопчиків: «Чи обдарований мій син?», ніж дівчаток: «Чи обдарована моя дочка?». І це при тому, що у дитинстві дівчатка мають більший словниковий запас і використовують складніші за конструкцією речення. В американських школах дівчата на 9% частіше, ніж хлопчики, займаються за програмами для обдарованих дітей. Незважаючи на це, батьки, сидячи за сімейною вечерею, частіше помічають обдарованих хлопчиків, ніж дівчаток. І якщо головні занепокоєння батьків стосовно синів стосуються їх інтелектуальних здібностей, то головні занепокоєння стосовно дочок – це зовнішність. Батьки вдвічі частіше цікавляться питанням схуднення дочок, ніж синів. Як і у випадку з інтелектом, це зовсім не пов’язано з реальністю: близько 28% дівчат мають зайву вагу у порівнянні з 35% хлопчиків.

ТАКОЖ ПРО КОРИСТЬ BIG DATA:

Чи можемо ми проковтнути пігулку правди?

Не можна удавати, що ці дані обнадіюють. Вони є свідченням того, що люди говорять те, що суспільство хоче почути, а не те, що, власне, думають. Цифровий детектор Big Data показує, що світ гірший, ніж ми думали. Однак, це знання може поліпшити наше життя щонайменше у три способи.

По-перше, можна заспокоїтися, дізнавшись, що ви не самотні у своїй невпевненості та поведінці, за яку вам соромно. У школі вчитель говорить дітям, що, якщо у них є питання, варто підняти руку і запитати. Але більшість дітей питань не задають, а тихенько сидять, боячись відкрити рот, осоромитися своїм незнанням чи нерозумінням. Анонімні сукупні дані Google дозволяють нам раз і назавжди зрозуміти, що у цьому випадку вчителі праві – у всіх нас є величезна кількість «дурних» питань, які потребують відповідей, і яких не варто соромитися.

Друга перевага цифрового детектора у тому, що ми дізнаємося про людей, які страждають. Кампанія з прав людини хоче використовувати анонімні та сукупні дані пошуку Google, аби вирішити, куди саме найкраще націлювати свої ресурси. І найбільша цінність отриманих даних – це здатність вести нас від проблем до рішень. Маючи глибше розуміння, ми можемо знайти спосіб скоротити кількість негативу.

Розглянемо промову Обами (Obama) про ісламофобію після подій у Сан-Бернандіно. Кожного разу, коли тодішній Президент США стверджував, що слід поширювати повагу до мусульман, люди, до яких він намагався достукатися, гнівалися ще більше. Пошуки Google, однак, показали, що одна фраза викликала іншу реакцію. Обама сказав:

«– Американці-мусульмани – наші друзі і наші сусіди, наші колеги, наші спортивні герої і наші чоловіки та жінки у військовій формі, які готові померти на захист нашої країни».

Після цієї фрази вперше більше ніж за рік топовий іменник у пошуку Google після слова «мусульманський» був не «терорист», «екстреміст» або «біженець», а «спортсмен», «солдат». Коли ми «читаємо лекції» розгніваним людям, дані пошуку свідчать, що їх лютість може зростати ще більше. Але викликаючи зацікавленість, даючи нову інформацію, пропонуючи нові образи групи, яка є об’єктом люті, можна перенаправити хід думок в інший, більш позитивний напрямок.

Це підтверджується результатами пошуку Google після іншої промови Обами, яка мала місце через два місяці після згаданої вище. Обама недовго акцентував на важливості толерантності. Натомість він зосередився на тому, щоб викликати інтерес слухачів, спробувати змінити їх сприйняття американців-мусульман: багато рабів з Африки були мусульманами; у Томаса Джефферсона (Thomas Jefferson) і Джона Адамса (John Adams) були власні копії Корану; американець-мусульманин конструював хмарочоси в Чикаго. Обама знову говорив про мусульманських спортсменів і військових, про мусульманських поліцейських і пожежників, вчителів і лікарів. Кількість негативних пошуків про мусульман знизилася вже через кілька годин після цієї промови.

Існують й інші потенційні способи використання даних пошуку, аби дізнатись, що викликає чи зменшує ненависть. Наприклад, ми можемо подивитися, як змінюються сексистські пошуки після того, як жінка обрана на впливову посаду. Знання про підсвідомі упередження теж корисні. Ми всі можемо докласти додаткових зусиль, щоб пишатися інтелектуальними здібностями дівчат і менше турбуватися про їх зовнішній вигляд. Дані пошуку Google та інші джерела правди в Мережі дають нам безпрецедентний погляд на темні куточки людської психіки. Іноді цю пігулку правди важко проковтнути. Але збір даних про світові проблеми – це перший крок до їх усунення. Доменний реєстратор №1 в Україні imena.ua

Джерело: The Guardian, переклад підготувала Ірина Гоял, спеціально для «Блог Imena.UA»

Читайте также:

Небо не межа: стратосферні проекти Airbus, Google та SoftBank

Bard стає Gemini – що цікавого анонсувала компанія Google

Потужність штучного інтелекту Google стане доступна в новій серії Samsung Galaxy S24

7 техногігантів із США зрівнялися з 5 країнами за часткою в індексі ACWI