Как «пробить» человека в Интернет: используем операторы Google и логику

ai-god.jpg

В очередной статье нашего цикла публикаций, посвященного интернет-разведке, рассмотрим, как операторы продвинутого поиска Google (advanced search operators) позволяют быстро находить необходимую информацию о конкретном человеке.

Для демонстрации возможностей «продвинутого» поиска Google в качестве целей были выбраны личные аккаунты автора. Сделано это, чтобы никого не обидеть излишним интересом к его частной жизни. Хочу сразу предупредить, что никогда не задавался целью скрыть свое присутствие в интернете, поэтому описанные методы подойдут для сбора данных об обычных людях, и могут быть не очень эффективны для деанонимизации фэйковых аккаунтов, созданных для разовых акций. Интересующимся читателям предлагаю повторить приведенные примеры запросов в отношении своих аккаунтов и оценить насколько легко собирать информацию по ним.



Прежде чем заниматься сбором и анализом информации о конкретном человеке необходимо представить всю картину того, какие данные о человеке существуют.

 

 

 

Подобную карту нужно детализировать до уровня, необходимого для решения конкретной задачи. Любой поиск информации начинается с некоторого начального набора данных. В нашем случае это будет фамилия, имя и место работы. Остальные данные где-то есть, но связать их с имеющимися мы пока не можем. Поэтому мы формируем гипотезы и проверяем с помощью поисковых запросов.

 

 

Источниками информации о человеке могут быть:

 

 

  1. он сам: аккаунты в соцсетях, блог и т.п.;
  2. государство: базы данных налоговой, судебных приставов, судов и т.п. См. ссылки в статье
  3. кто-то еще (друзья, враги, СМИ, работодатель и т.п.)

 

 

В настоящей статье рассмотрим п.1. – будем вычислять аккаунты автора в социальных сетях.

 

 

Цель номер один: ники пользователя

 

 

Что такое ник и как мы его выбираем?

 

 

Ник представляет собой наше имя в интернете: мы выбираем его, создавая свой личный почтовый ящик, а потом часто используем и в различных сервисах.

 

 

Мы ничем не ограничены при выборе ников, но есть любимые алгоритмы формирования наших интернет-имен:

 

 

  1. Игры со своим именем: фамилия, имя+фамилия, имя+год рождения, имя+дата, инициалы;
  2. Игры с именами любимых персонажей (tovbender, napoleon);
  3. Немного о себе: профессия, психология (coolhacker, murmur);
  4. Демонстрация увлечений: footballer, boxer;
  5. “Чтобы никто не догадался”: слово наоборот, русское слово в английской раскладке, слово на латыни и т.п.

 

 

Если мы не знаем ник, но знаем кое-что о человеке, мы уже можем строить предположения и проверять их.

 

 

Хорошим способом вычислить ник пользователя является поиск и анализ его страниц в соцсетях и поиск адреса личной электронной почты.

 

 

Начать поиск информации о конкретном пользователе можно с простого запроса, подобного следующему:

 

 

джон смит ромашка


где «ромашка» — название компании.

 

 

На текущий момент мы должны вспомнить, что некоторые особенности работы поисковика Google:

 

 

  • Google читает запрос слева направо.
  • Google не различает регистр: «Земля» и «земля» для него одно и то же;
  • длина запроса не должна превышать 32 слов;
  • * представляет одно слово в запросе;
  • можно искать точную фразу, взяв ее в кавычки;
  • между словами в запросе стоит невидимое логическое «И»;
  • Google сам умеет склонять слова;
  • Оператор «-» исключает из выдачи результаты, которые содержат выражение, помещенное сразу за данным оператором (обязательно без пробела).
  • в верху выдачи находятся страницы, которые, по мнению Google, являются самыми релевантными. Тем не менее это его догадка, так как наших мыслей он читать пока не умеет;
  • для уточнения параметров поиска необходимо владеть операторами продвинутого поиска (advanced search operators).

 

 

Теперь можно ввести аналогичный запрос по автору статьи и получить массу страниц, среди которых должна быть и искомые страницы в социальных сетях:

 

 

 

 

Информации в выдаче поисковика достаточно много, и чтобы найти страницы в социальных сетях нам придется пересмотреть большое количество страниц.

 

 

Примечание:

 

 

Кстати, а что делать, если мы хотим найти человека из определенной компании, но забыли его фамилию? Тут может помочь оператор звездочка:

 

 

джон * ромашка

 

 

А если мы ищем человека из ООО «Ромашка», а таких «Ромашек» — миллион: и АО «Ромашка», и АНО «Ромашка», и ФГУП «Ромашка» и т.д.

 

 

Вариант 1. Искать полную фразу «ООО Ромашка».

 

 

Вариант 2. «Минусовать» ненужные слова: -АНО – АО –ФГУП (но так можно «заминусовать» и нужные результаты, например если на странице говорится, что наша «Ромашка» подружилась с ФГУП «Апельсин».

 

 

Теперь нам необходимо сузить выдачу и найти страницу автора статьи в социальной сети «ВКонтакте». Это позволит нам определить один из ников пользователя, а затем и вычислить адрес электронной почты. Для этого будет полезно использовать такой оператор, как site. Он ограничивает поиск определенным доменом любого уровня.

 

 

 

 

Вторая ссылка уже ведет на страницу автора статьи в сети «ВКонтакте». Обратите внимание, что автор сознательно выбрал короткий ник: alexdorofeev. Не все интернет-ресурсы дают возможность самим задать ссылку на свою страницу, иногда она формируется автоматически, но может содержать в себе ник, взятый из адреса электронной почты.

 

 

Используя добытую информацию и знания, постараемся найти аналогичную страницу в сети Facebook.

 

 

Сначала на удачу в браузере введем следующий URL: https://www.facebook.com/alexdorofeev, но, к сожалению, увидим, что страница принадлежит кому-то другому. Тогда воспользуемся проверенным приемом и добавим в запрос site:facebook.com.

 

 

 

 

В результатах выдачи отсутствует прямая ссылка на профиль, который мы ищем, так как пользователь проявил в свое время бдительность и запретил «сдачу» его странички поисковикам

 

 

 

 

Здесь необходимо снова сделать небольшое отступление и вспомнить как работают поисковики и в том числе Google.

 

 

Что поисковики сделать могут, а что не могут?

 

 

Поисковики в общих чертах работают по следующему алгоритму:

 

 

  1. боты поисковых машин обходят сайты;
  2. содержимое страниц индексируется;
  3. по запросу пользователей извлекаются ссылки на релевантные страницы.

 

 

Поисковики не могут:

 

 

  • проиндексировать информацию, доступ к которой возможен только авторизованным пользователям;
  • данные, которые доступны после заполнения форм, например, результаты выгрузки из различных баз данных;
  • качественно извлечь информацию из видео, фото, аудио-материалов.

 

 

Еще некоторые нюансы: