Twitter годами фиксировал точные GPS-координаты пользователей
Как сообщает searchengines.ru, международная группа исследователей разработала инструмент, который способен в течение нескольких минут с 92,5% точностью определить, где живёт человек, используя данные Twitter. С его помощью также можно узнать, где пользователь работает, а также проводит своё свободное время.
Инструмент под названием LPAuditor (Location Privacy Auditor) использует особенности работы функции геолокации в Twitter, позволяющей пользователям указывать в твитах своё местонахождение.
Как выяснилось, в течение нескольких лет после запуска этой функции в 2009 году даже при указании такой широкой категории, как город, Twitter автоматически фиксировал точные GPS-координаты пользователя. Эти данные не видели ни автор поста, ни его подписчики, но они включались в метаданные твита и всё ещё доступны через API Twitter.
Автоматическая передача координат происходила с 2009 по апрель 2015 года. Затем сервис микроблогов изменил свою политику, и теперь пользователи должны дать согласие на передачу их координат. По словам представителя Twitter, на сегодняшний день это делает лишь очень небольшой процент людей. Однако те данные, которые были собраны раньше, по-прежнему доступны через API.
При этом в компании заявили, что отправка геолокационных данных в Twitter всегда была добровольным делом, и у пользователей всегда была возможность удалить эти данные в настройках. Однако ею пользовались немногие.
«Если вы не знаете о проблеме, вы не будете удалять эти данные», — ответил на это исследователь из Иллинойского университета Джейсон Полакис (Jason Polakis).
Исследователи начали извлечение метаданных Twitter через API компании в ноябре 2016 года. Ранее они провели исследование, которое показало возможность получения конфиденциальной информации из твитов с геометками. Теперь они хотели узнать, могут ли они получать эти данные в более широком масштабе и с большей точностью, используя автоматизацию.
В ходе работы специалисты с помощью LPAuditor проанализировали выборку из 15 млн геотаргетированных твитов от примерно 87 тысяч пользователей. Инструмент присвоил каждому твиту место на карте и определил его временной пояс. В результате был сгенерирован кластер твитов на карте с указанием мест, которые пользователь посещал чаще всего – по крайней мере, на момент публикации твитов.
Чтобы определить место проживания пользователя, исследователи анализировали те места, где он проводил больше всего времени на выходных.
Для верификации полученных с помощью инструмента данных исследователи определили группу из примерно 2000 человек и вручную проверили все их твиты, чтобы найти те фразы, которые могли подтверждать нахождение человека дома или на работе, а также соответствующий контекст.
Затем они сравнили местоположение этих твитов с результатами, полученными с помощью инструмента, и пришли к выводу, что точность его работы составляет 92,5%.
По большей части это исследование было основано на твитах, отправленных до изменения политики Twitter в апреле 2015 года. После обновления получение таких данных стало затруднительным.
Однако исследователи считают, что только изменения политики сервиса недостаточно, ведь через API Twitter собранные ранее данные по-прежнему доступны. И хотя эта информация может быть устаревшей, она всё равно может представлять собой ценность для злоумышленников.