Конспект книги «Любовь по алгоритму. Как Tinder диктует, с кем нам спать»
Я бы очень хотел, чтобы каждый кто есть в социальных сетях прочитал эту книгу. Неважно пользуетесь ли вы сайтами знакомств или нет. История журналистки Жюдит Дюпортей помогает понять, как в действительности далеко ушли технологии и как они будут влиять на нашу дальнейшую жизнь.
Местами мне казалось, что автора заносит на теме феминизма и паранойи личных данных, а также личной расстройства психики. Но чем глубже я погружался в историю, тем больше ловил себя на мысли, что сам бы в похожем состоянии. Книга читается, как продолжение романа Бегбедера «Любовь живет три года» только в эпоху Тиндера. Жюдит пишет остроумно, цинично и горько.
Неудивительно, что объяснение алгоритмов Тиндера находится на последних 50 страницах. Расследование Жюдит привело ее в систему патентов. По сути, чтобы понять как устроен тот или иной сервис достаточно забить это в Google Patent. Жаль, что она потратила на это 1,5 года. Когда все было под носом. Но при этом нельзя сказать, что остальное не имеет смысла. Как раз наоборот. Переживания автора объясняют почему модель Тиндера и его алгоритмов обесценивают наши чувства и как наши данные используются.
Тиндер основан на патриархальной модели гетеросексулаьных отношений. Где-то здесь радуется Елена Борисовна Мизулина. Именно сейчас мы это и увидим. Девачки, держитесь, вас это может оскорбить. В этом посте я рассматриваю только технологическую сторону книги. Ключевые пункты из патента Тиндера, которые приводятся в книге:
Ключевые слова
Из патента: «Сервер может быть настроен так, чтобы искать в профилях пользователей ключевые слова, связанные с их деятельностью или интересами. Анализ ключевых слов может быть использован сервером, чтобы подобрать пару для пользователя.»
Если написать обожаю собак, то Тиндер будет искать больше женщин у которых это встречается в профиле. Безусловно это будет один из признаков, но не главный. Чем больше совпадений по ключевым словам, тем выше вероятность, что сервер покажет профили друг другу.
Фотографии
В 2018 году Тиндер стал использовать алгоритм Rekognion от Amazon. Это визуальное распознавание фотографий. Если у вас на фото гитара, то вероятно, что ИИ поставил вам тег «творческий», а если катаетесь на сноуборде, то вероятно «поклонник спорта на открытом воздухе». Это все для того, чтобы вас свести с похожими людьми.
Судьба
Из патента: «Сервер может быть настроен так, чтобы выискивать совпадение интересов, места рождения, даты рождения, университета, имени, фамилии, никнейма, и ключевых слов, чтобы создать впечатление, что пользователи были созданы для того, чтобы быть вместе.»
Охуенно, звучит, да? Это называется вера в судьбу. Система может показать такой профиль будто вы всегда были созданы друг для друга. Но это еще не все. У системы есть выбор. Она может вас свести вместе, а может и нет. Но в приведенном мной абзаце система намерено показывает, а в другом варианте делает так, чтобы вы поверили в судьбу. Во время общения с некоторыми девушками я ловил себя на мысли, что как так? Мы смотрим одно и тоже, слушаем похожее и даже были в похожих местах. Хотя система это никак не подсвечивала. Т.е. выяснилось в процессе.
Рейтинг успеха
Каждому профилю присваивается определенный рейтинг на основании того, как часто он показывается. Далее система определяет оценку вашей физической привлекательности. У Жюдит кстати с помощью API получилось узнать свой рейтинг. Для всех остальных эта закрытая тема, а для разработчиков Тиндера больная. Потому что большинство расследований в СМИ, как раз посвящены этому.
География
Из патента: «Сервер может быть настроен таким образом, чтобы регулировать оценку, выданную анализом географической близости, в свете других факторов. Например, сервер может выдать оценку, соответствующую близости в 10 км, когда реальная дистанция между пользователем B и пользователем A равняется 50 км, если у них схожий уровень дохода, возраст и уровень образования.»
Это мое самое любимое. Часто мне выпадают профили из Москвы или даже Европы, но в настройках стоит радиус 50 км от Новокузнецка. Прокопчанки, привет! Теперь понятно почему так происходит. И это не баг, как думал я, а вполне конкретная часть работы алгоритма.
Агрегация данных
Тиндер использует также данные из Facebook: всестраницы которые вы лайкаете, общие друзья, геолокация, музыкальные предпочтения из Spotify. Т.е. он ищет максимально похожих пользователей на нас. Ой-ой, таргетологи должны здесь вспомнить про looklike аудитории в Facebook.
Продажа данных
Из текущей политики конфиденциальности «Тиндера»:
Предоставление вашей информации нашим поставщикам услуг и партнерам
Прибегаем к услугам третьих сторон для поддержки наших операций и улучшения наших сервисов. Эти третьи стороны помогают нам в решении различных задач, включая размещение и обслуживание данных, аналитику, обслуживание клиентов, маркетинг, рекламу, обработку платежей и операций по обеспечению безопасности.
Мы также можем предоставлять информацию партнерам, которые распространяют и помогают нам рекламировать наши сервисы. Например, мы можем предоставлять ограниченную информацию о вас рекламным партнерам в хешированном, нечитаемом формате.
Мы проводим строгую проверку перед тем, как привлечь поставщика услуг или начать работать с партнером. Все наши поставщики услуг и партнеры должны согласиться с соблюдением строгих обязательств в отношении конфиденциальности.
Это значит, что Тиндер торгует нашими персональными данными дополнительно зарабатывая, помимо того, что вы покупаете себе Gold-подписку. Или показать таргетированную рекламу тем, кто сейчас страдает или приуныл, если не нашел себе пару. Да-да, весьма часто эти данные используются в коммерческих целях, когда после расставания человек пытается что-то в себе изменить.
Бонусы
Все профили участвуют в таком аукционе, где происходит работа по сравнению по разным критериям и признакам. Причем бонусы начисляются индивидуально в зависимости от того с кем нас сравнивают. Представьте две комнаты, где в одной мужчины, а в другой женщины. Невидимая рука Тиндера выбирает двух кандидатов на основании очков. Чем больше у вас очков, тем чаще вы показываетесь. Любая информация, будь то возраст, профессия или уровень дохода, приносит очки.
Тян
Из патента: «Исключительно в качестве примера представим, что Гарри и Салли — пользователи сервиса <...>. Допустим, Гарри старше Салли на 10 лет и зарабатывает на 10000 долларов в год больше, кроме того, у него есть степень магистра,. а у Салли только среднее образование. Несмотря на, такие несоответствия, сервер выдаст Салли более высокую оценку, и вероятность того, что Гарри увидит ее профиль, возрастет.»
Молодые девчонки до 21 года с низким образованием и уровнем дохода получают высокую оценку от системы и могут попасть в ТОП-5 подборок для мужчин (Top Picks) с которыми ее сравнивают.
Эмпирические наблюдения
Из патента «Однако если бы Салли искала, партнера и сервер оценивал бы профиль Гарри, вероятно, оценка была бы иной. То есть если бы Салли была на 10 лет старше, зарабатывала бы на 10000 долларов больше и имела бы университетский диплом против школьного аттестата, Гарри, сервер бы низко оценил профиль Гарри, и его шансы появиться среди кандидатов Салли упали бы.»
В обратную сторону не работает. Если ты бизнес-леди в возрасте, то тебе не светят молоденькие мужчины. Занимательно, что в параметр в Tinder, как genderrole traditionalism. Как раз он измеряет привлекательность человека в зависимости от его пола и разницы в возрасте по отношению к тому с кем его сравнивают. И здесь больше очков получают мужчины в возрасте и молодые девушки.
Причем конфигурация сервера объясняет эту модель в патенте: «Эта возможная конфигурация сервера, объясняется эмпирическими наблюдениями, показывающими, что такие демографические различия по-разному влияют на выбор, который делают мужчины и женщины в контексте любовных отношений.»
Мир глазами Тиндера: женщины предпочитают более зрелых и богатых мужчин, а мужчины выбирают девушек по моложе. Именно это и транслирует Тиндер. Казалось бы я должен радоваться, что у меня сейчас есть приоритет перед молодыми девчонками, но штука в том, что лично моя анкета среди них не пользуется популярностью. Но это уже другая проблема.
Рейтинг Эло
Каждому юзеру Тиндера присваивается оценка по рейтингу Эло. Термин пришел из мира шахмат, где с помощью него игроков распродают в мировой классификации. Рейтинг Эло — часть особого раздела математики, теории игр. Она изучает и пытается спрогнозировать выбор человека в каком-либо взаимодействии.
Рейтинг был придуман в начале ХХ века Арпадом Эло, американцем венгерского происхождения, любителем шахмат и профессором физики. С тех пор система стала основой для множества классификаций не только в соревнованиях по игре в скрэббл или нарды, но и в спорте.
Рейтинг Эло — это коэффициент, присваиваемый каждому игроку в зависимости от предыдущих успехов в определенной области. Например, футболист зарабатывает очки, когда забивает голы или выигрывает матчи. Но поскольку обыграть мюнхенскую «Баварию» сложнее, чем «Генгам», за каждый выигранный матч присуждается разное количество баллов. Чем сложнее игра, тем больше очков! Та же логика, сработает, если вы проиграете противнику слабее.
В реальности Тиндера — это происходит так: показываются два профиля. Допустим Миша Тугушев из Осинников и какая-нибудь молодая актриса 20 y.o из Москвы. Она лайкает Мишу и ему начисляется бонусы. Будто бы осинниковский «Шахтер» победил московский «Спартак». Но такое происходит 1 раз в 3 года. Если актриса свайпает влево, то очки снимаются. Рейтинг снижается. Система немного не справедлива, да? Увы, нам про это нигде не пишут и не говорят, что мы участвуем в каком-то соревновании. И наши мэтчи зависят от нашего рейтинга.
Итог
Как давнишний пользователь Тиндера я доверяю тому, что написано в книге. Множество из того, что написано в патенте наблюдал во время использования приложения. Любопытно, что официальный ответ Тиндера не оспаривает статью Жюдит, но и не опровергает. Они лишь указывают, что представленный патент соответствует «духу» приложения, но в реальности ситуация может отличаться.
Итак, подытожим, что оценивает система: интересы, психологическое состояние, доход, географию, привлекательность, ум (IQ). После чего каждому пользователю присваивается оценка. Эта оценка и есть секрет Тиндера, как рецепт Кока-Колы и узнать ее невозможно. Мы видим, что алгоритмы — субъективны. Они своего рода отражение человека, который их создал. Все зависит от его личных убеждений, психологической зрелости и морально-этических норм.
Система кажется вполне разумной, так как помогает искать похожих на тебя людей, но при этом есть изъяны, что тебе буду подсовывать молоденьких красавиц, если ты успешный взрослый самец. При этом часть людей всегда будут проигрывать в этой системе, так как их пол и возраст будет оцениваться низкой оценкой. Напоминает вам серию Черного зеркала? Где каждое твое действие оценивают другие люди и если твой рейтинг падает, то ты становишься изгоем общества.
С другой стороны я надеюсь, что в будущем пользователь будет распоряжаться своими данными. Никаких перепродаж и перемещение их без моего ведома точно не должно быть. Вспоминается история с капчей, которую мы все учили совершенно бесплатно отличать светофоры от автомобилей.
Что еще почитать
Исследование Facebook о поведении пользователей после расставания.
Паттен Matching process system and method под номером us2018/0150205a1.
Научные работы профессора цифровых гуманитарных наук Джессики Пиду о методах алгоритмов, которые используют сайты знакомств.
Статья Жюдит Дюпортей в Гардиан по данным, которые ей прислали из Тиндера. Аж, целых 800 страниц интересов и переписок.