Как вести разведку с помощью Интернета?

218188_original.jpg

По некоторым оценкам, ресурсы "всемирной паутины" составляют 550 млрд. документов, из которых 40 % доступны бесплатно. Навигацию в этом многообразии информационных ресурсов обеспечивают более миллиона поисковых систем, каталогов, баз данных.

Американские правительственные агентства давно уже оставили Интернет в покое, обзаведясь более мощными и дорогостоящими игрушками. В свое время каждое разведывательное ведомство США по соображениям безопасности создавало свои собственные системы сбора и распределения информации (АНБ - КРИТИКОМ, РУМО -ДЖЕЙВИКС, ДОДИИС, АМХС). Естественно, с течением времени назрела острая необходимость в их объединении, и уже в начале 90-х годов была поставлена задача создать в Интернете невидимый для большинства пользователей специальный закрытый, или, как его еще называют, секретный Интернет.

Хотя в этой секретной сети, получившей название Интерлинк, также используется традиционный протокол TCP/IP, непосредственный доступ к секретной информации осуществляется через специальный протокол HTTPS при наличии специального браузера с набором криптографических алгоритмов, поставляемого только для зарегистрированных пользователей Интерлинк.

Сеть Интерлинк имеет четыре уровня доступа к разведывательной информации по степени секретности: первый уровень представляет особо важная информация для принятия политических решений, которую готовит и распределяет только ЦРУ через специальную сеть ПОЛИСИНЕТ для президента и Совета безопасности; второй - информация, имеющая гриф "совершенно секретно", к которой имеют доступ около 50 тыс. пользователей; третий - секретная информация, связанная с планированием военных операций, к которой имеют доступ 265 тыс. пользователей сети СИПРНЕТ; четвертый - несекретная информация из открытых источников (печать, Интернет, телевидение, радио), которая составляет свыше 95 % всей добываемой разведкой информации.

Каталоги

Каталоги представляют собой весьма удобный вид доступа к данным. Каталоги - это рубрикаторы или классификаторы, организующие множество документов в деревья или целые заросли рубрик.

Однако есть и весьма существенное НО: для эффективного использования каталога пользователю нужно правильно угадать принцип структуризации, который был применен при его создании и который зачастую существует только в головах авторов каталога. Поэтому для компенсации неудобств каталогов (если уж пользователь не знает, на какой ветке дерева "по логике" данного каталога лежит нужная ссылка, то не найдет ее никогда) они в последнее время стали включать и средства поиска. И наоборот - поисковые машины стали снабжаться каталогами; в частности обзавелся своим тематическим каталогом ресурсов ветеран русского Интернета "Рамблер".

В качестве примера для возможных изысканий можно привести следующие каталоги: "I Yahoo" (yahoo.com); "Ау!" (au.ru); "List.Ru" (list.ru); "Рамблер" (rambler.ru); "Лица российских сайтов" (sites.ru:8000); "Улитка" (ulitka.ru); "Золотое Кольцо Российского Интернета" (catalog.net).

При работе с классификаторами следует учитывать, что сайты классифицируются разными каталогами по-разному, это и понятно, так как Интернет-пространство в принципе не может быть упорядочено линейно, оно имеет более сложную геометрию.

Например, каталог "Omen.Ru" (omen.orc.ru) уже на первом уровне структуризации своей коллекции оперирует более чем с 200 рубриками. "Рамблер" в качестве стартовой процедуры поиска информации предлагает 50 рубрик, одна из которых - "Классификаторы" - объединяет более 200 каталогов.

Сайты, обнаруженные в каталогах, например, бесплатные базы данных о регистрации зарубежных предприятий:

Великобритания companies.house.gov.uk

Италия infoimprese.it

Франция infogreffe.fr и sociate.com

Республика Кипр mcit.gov.cy/drcor

Словакия orsr.sk

Чехия justice.ee

США (штат Делавэр) sos7es.state.de.us/tin/GINameSearch.jsp

могут оказаться весьма полезными в дальнейшей работе.

Помимо хранилищ общего назначения существует множество специализированных каталогов, помогающих пользователям ориентироваться в достаточно узких предметных областях.

В качестве примера приведу несколько очень полезных сайтов различных государственных структур: gks.ru - сайт Госкомстата, customs.ru - сайт Таможенной Службы, cbr.ru - сайт Центрального банка России, fedcom.ru - сайт Федеральной комиссии по ценным бумагам.

Ну а для тех, кто желает повысить свой профессиональный уровень, познакомиться со свежими новостями, а также пообщаться с коллегами на форуме, можно порекомендовать для ознакомления следующие специализированные сайты, посвященные вопросам безопасности: Интернет-газета по безопасности (oxpaha.ru), портал it2Ь "Технологии разведки для бизнеса" (it2b.ru), сайт по безопасности (sec.ru) и сайт "Агентура" (agentura.ru). С более полной подборкой сайтов по вопросам безопасности можно ознакомиться в тематическом каталоге Рамблера "Безопасность".

Поисковые системы

Еще один простой и дешевый способ информационно-поисковой работы в Интернете - воспользоваться услугами бесплатных поисковых систем.
С помощью поисковых систем можно осуществлять различные манипуляции с информацией: индексирование текстов и поиск по одному (нескольким) ключевому слову (по индексу); морфологический поиск - разбор и отождествление различных грамматических форм слов; ранжирование по степени соответствия документа запросу.

На сегодняшний день самыми эффективными русскоязычными поисковыми системами являются Яндекс (yandex.ru), Апорт (aport.ru), Рамблер (rambler.ru). Из личного опыта могу посоветовать начинать именно с Яндекса, у него самая производительная поисковая машина, к тому же на его сайте имеются ссылки практически на все другие поисковики. Так, например, Яндекс дает ссылку на одну из лучших западных поисковых машин Google (google.com), которая при поиске информации просматривает свыше 1 600 млн. страниц.

Стоит отметить, что даже самые лучшие поисковые машины обрабатывают только вершину имеющегося в сети информационного айсберга. Поисковые роботы не могут просматривать закрытые для них коммерческие сайты, число которых в настоящее время приближается к миллиону. Эти сайты различны по содержанию (информация правительственная, законодательная, статистическая, научно- техническая, патентная, новостная и т.п.) и форме - например, сайты, содержащие видеоинформацию, музыкальные сайты.

Поиск нужной информации в данном случае осуществляется по следующему алгоритму: задается ключевое (поисковое) слово или фраза, и система ищет данное слово или фразу в базе данных, автоматически составленной поисковой машиной на основе текстового содержимого исследуемых сайтов.

Имеющимися техническими средствами полностью формализовать процедуру поиска информации пока не представляется возможным. Из-за того, что до настоящего времени не существует стандарта на размещение информации в Интернете, реализовать сложную стратегию поиска часто бывает весьма затруднительно. Поэтому при ведении аналитической разведки средствами Интернета приходится идти по пути информационной избыточности, что накладывает весомые ограничения на релевантность найденных документов. Из-за высокого процента информационного шума в общем объеме найденных документов значительно увеличивается время, необходимое для аналитической обработки полученных сведений.
Следует отметить, что результативность поиска в данном случае зависит от двух составляющих.

Во-первых, от степени соответствия ключевого слова или фразы поставленной информационной задаче, т.е. релевантности информационного запроса.

Причем если по первому запросу поисковая система нашла слишком много документов, то уже по отобранному массиву можно провести второй поиск с заданием дополнительных условий и тем самым сузить круг выдаваемых документов. Эта функция очень проста в исполнении (нужно только запомнить предыдущую выборку) и реализована в большинстве популярных машин, включая российские "Яндекс" и "Рамблер".

Помимо этого в современных поисковых машинах - западные AltaVista и HotBot, российские "Яндекс" и "Рамблер" - существует (по крайней мере, декларируется) функция интерактивного поиска ("найти похожие"). Она также позволяет постепенно уточнить запрос: указать на один или несколько найденных документов и попросить найти документы, повествующие "о том же". Выполняется такой поиск путем превращения документа в поисковый запрос (естественно, с определенной степенью "сжатия", так как запрос слишком большим быть не может). Но нужно отметить, что работает эта функция весьма "капризно" - очень часто находит совсем не то, что ищешь.

Во-вторых, у каждой поисковой системы свой алгоритм поиска и перечень сайтов, входящих в базу данных поиска, поэтому при одном и том же запросе результаты поиска в различных поисковых системах могут значительно отличаться. Поэтому для чистоты эксперимента лучше всего последовательно "прочесать" информационное пространство Интернета при помощи нескольких поисковиков. При поиске информации о конкретных хозяйствующих субъектах или о целых экономических регионах особое внимание стоит уделить поиску официальных сайтов субъектов Федерации и муниципальных образований, где расположены объекты вашего оперативного интереса.

При этом не стоит ограничиваться элементарным "скачиванием" заинтересовавшего вас документа. Стоит "обработать" весь сайт как следует. Это связано с тем, что очень часто на нем имеются ссылки на сайты местной торгово-промышленной палаты, средств массовой информации и т.д.

В качестве примера можно привести следующий случай. Служба безопасности предприятия, собирая информацию в отношении предполагаемого партнера в одном отдаленном субъекте Федерации посредством Интернета, вышла на официальный сайт данного субъекта Федерации.

Официальная пресса, представленная там, расписывала возможного партнера, не жалея творческих сил и бюджетных средств. Но аналитики пошли дальше и через ссылку на официальном сайте администрации вышли на сайт торгово- промышленной палаты, а оттуда на сайт, посвященный местным СМИ. С данного сайта вышли на материалы одной из оппозиционных главе администрации региона газет и этим существенно расширили свои знания об исследуемом объекте на предмет имевшегося на него "негатива".

Кстати, при правильном подходе даже официальные сайты предприятий могут сообщить вам очень много интересного.

Так, например, накануне большой отраслевой ярмарки одна из крупных западных компаний на сайте своего основного конкурента обнаружила информацию о массированной кампании по стимуляции своего товара. Это позволило вовремя переработать подготовленный к выставке прейскурант и лишить конкурента возможности сыграть на явном ценовом преимуществе.

Или, например, если в сети появилось объявление вашего конкурента о поиске специалиста в новой для него области, то это может стать сигнальной информацией для вас о предстоящей смене приоритетов в хозяйственной политике конкурента.

Аналогично, если оперативно нужна информация по предполагаемым зарубежным партнерам, то при соответствующем подходе и знании иностранного языка, это тоже не проблема. На западных серверах существует масса доступных сайтов с очень интересной информацией, надо просто знать, где и что искать.

В начале 2005 года в Интернете для публичного тестирования открылся сервис ZabaSearch, являющийся одним из самых полных и всеобъемлющих поисковиков по информации в отношении персоналий, проживающих в США.

ZabaSearch идет дальше обычных бесплатных поисковиков типа Yahoo People Search, функциональность которых ограничивается лишь сведениями из телефонных справочников.

Информационная база ZabaSearch включает в себя неопубликованные телефонные номера, персональную информацию за последние десять лет и спутниковые снимки жилья. Свои индексные базы данных ZabaSearch формирует, обрабатывая тысячи источников в Интернете. Сейчас его индекс содержит более 2 млрд записей - в среднем по 10-12 записей на каждого гражданина США.

По бесплатному поисковому запросу, если в нем правильно указаны фамилия и штат проживания разыскиваемого человека, вы можете получить имя, дату рождения и домашний телефон любого американца.

Ну а если вы раскошелитесь на $25, то вам предоставят целое досье, включающее в себя информацию о приводах фигуранта в полицию, его налоговых долгах и банкротствах.

Торговля персональной информацией в США - это многомиллиардный рынок, операторами которого выступают различные организации, включая банки и государственные учреждения. Так, например, свои сведения о клиентах продает Государственная почтовая служба США.
(США: ZabaSearch - "боковичок" "ЭШЕЛОНА" по персональной информации... для шпионов и детективов. oxpaha.ru/view.asp714906) Основные недостатки "бесплатной" информации - это не гарантированная полнота и достоверность данных, а также значительные затраты времени, необходимые для поиска нужных сведений.

Частенько представленные на сайтах данные вообще не обновляются или обновляются крайне нерегулярно. В качестве примера возможной неполноты имеющейся в Интернете информации можно привести тот факт, что, например, до сих пор на некоторых сайтах висит таблица Менделеева, в которой только 84 элемента, тогда как сейчас известны уже 112 (некоторые пока не имеют названия).

alex-talaman.livejournal.com