Суббота, 24 октября 2015 15:13

Твиттер знает, сколько вы зарабатываете

surv.jpg.640x353 q95Твиттер — в значительной степени открытый форум, и большинство пользователей знают об этом. Если вы опубликуете то, что хотели бы оставить в тайне, то вам не повезло. Но большинство людей не понимает, что одно только использование Твиттера может раскрыть о вас больше информации, чем вы собирались предоставить. Издание Fast Company рассказывает о том, куда и зачем уплывают данные из ваших соцсетей.

Специалисты по обработке данных становятся экспертами по выстраиванию предположений о людях, основываясь на едва заметных нюансах из открытых соцсетей, таких как используемый язык, круг друзей и темы, которые обсуждают пользователи. Наблюдая за моделями поведения в бесконечном потоке информации Твиттера, эксперты разработали способы, с помощью которых они могут предсказать возраст пользователя, пол, местоположение, индивидуальные особенности, политические предпочтения и даже пребывание в депрессии, даже если такая информация дана не явно.

«Дело даже не в том, что вы говорите и как: ваши связи с друзьями и подписчиками тоже многое о вас рассказывают», — говорит Кристо Вильсон, IT-специалист из Северовосточного университета, который изучал влияние алгоритмов, используемых для оценки потребителей в интернете.

Последнее открытие в этой области, опубликованное в журнале PLoS One в сентябре, показало, что через Твиттер можно вычислить примерный уровень дохода пользователей.

В этом исследовании учёные рассмотрели около 5000 профайлов, которые ясно описывали работу человека, будь то исполнительный директор или шахтёр. Полагаясь на трудовую классификацию правительства Великобритании, они сопоставили работу пользователя с его средней зарплатой и изучили поведенческие модели в Твиттере, которые могли бы предугадать точный заработок каждого. После создания прогнозирующей модели учёные могли определить доход неизвестного пользователя с высокой точностью — достаточной для того, чтобы сказать, к какой группе населения с каким уровнем дохода он относится.

Команда ученых заинтересована в том, чтобы демографические данные стали более доступными для исследований в области социальных наук. Однако те же самые прогнозы могли бы быть полезны для маркетологов, компаний, торгующих информацией, работодателей и государственных органов.

«Всё что, люди выкладывают, находится в открытом доступе, поэтому им стоит понимать, сколько информации компании могут о них собрать», — говорит Даниель Преотиук-Пьетро, исследователь в университете Пенсильвании и ведущий автор работы.

В прошлом году отчёт Федеральной торговой комиссии показал, что дата-брокеры — фирмы, собирающие подробные профайлы людей, зачастую нарушая их права, для продажи маркетологам — уже включили соцсети в свой анализ. Не за горами и более углублённое изучение Твиттера для подробного прогнозирования.

Учёные проводили лингвистические анализы десятилетиями — на основе писем, заметок, а теперь и электронной почты. Но бум соцсетей упростил этот процесс и позволил развернуть его в более крупных масштабах. Согласно данным PLoS, исследователи обнаружили, что пользователи с высоким доходом склонны выражать больше «злости» и «страха» в своих твитах, но в целом меньше эмоций. Пользователи с низким доходом, с другой стороны, бранились больше и при этом были оптимистичнее. В их твитах было меньше ссылок — размышления пользователей в 140 знаков были более личными.

Значит ли это, что богатство делает вас злее? Разумеется, исследование доказывает не это. Оно лишь показывает, что выражение гнева, особенно в Твиттере, и зарабатывание большего количества денег сопутствуют друг другу. В другом примере общественный инструмент, разработанный Джеймсом Пиннбейкером, психологом из университета Техаса, позволяет анализировать особенности вашей личности, полагаясь на Твиттер (Преотиук-Пьетро утверждает, что он работает над похожим инструментом, который прогнозирует доход любого человека). Просто вбейте свой id из Твиттера в AnalyzeWords.site, и он выдаст вам результаты.

Почему это так важно? Помимо того, что вы заботитесь о сохранности вашей личной информации, благодаря данным о возрасте и доходе становится легче вас дискриминировать при приеме на работу или совершении онлайн-покупки.

«Эту информацию можно применить множеством способов, но самый мощный из них — это маркетинговый анализ: кто пишет твиты о моей компании/продукте, какие чувства они выражают в беседах, к какому слою населения относятся эти люди? Отсюда вы начинаете переходить к стратегиям влияния (как мы можем повлиять на разговор?) и сегментацию (разделяя людей на категории по качественным признакам)», - пишет в письме Вилсон. Он отмечает, что, скорее всего, это обусловлено покупкой Твиттером Gnip — компании, которая поставляет информацию из ленты в социальных сетях другим компаниям.

И поскольку алгоритмы принимают всё более и более автоматизированные решения, результаты могут стать менее прозрачными для общественности. Неужели я настолько же высокомерный, как утверждает анализ моей ленты в Твиттере? Хотелось бы думать, что нет, но если какое-то программное обеспечение в мире оценит меня таким образом, я никогда даже не узнаю об этом.

http://rusbase.com/