Интернет - разведка. Создание базы данных с помощью информации получаемой в Интернет

wwwru.jpg

Проведению кампании в интернет всегда будет предшествовать исследовательский этап в сети чтобы понимать в каком направлении, зачем и почему мы должны двигаться и какая информация для нас имеет цену. В то же время, нам необходимо знать какие шаги предпринимаются нашими конкурентами, что думает о них и о нас общественность и где это мнение формируется.

Сегодня практически все крупные и небольшие организации используют Интернет как ключевое средство коммуникации, доступное для клиентов, партнеров, акционеров и других целевых аудиторий, заинтересованных в этом бизнесе. В результате Интернет превратился в неплохой источник информации для внешнего мира. Сколько бы не говорилось о том, что, как и любой общедоступный источник информации, Интернет не представляет особой ценности, Интернет- разведка, как ни странно, дает удивительные результаты.

Конкурентная разведка предполагает сбор и анализ информации получаемой из общедоступных открытых источников.


Классификация источников информации
  • Информационные агентства, корреспонденты которых собирают новости по городам и весям, — наиболее объективный, точный и, возможно, в меньшей степени подверженный конъюнктурным влияниям источник информации.
  • Журналисты и редакторы СМИ — лица «второй древнейшей профессии», зарабатывающие себе на хлеб кто как умеет. В зависимости от респектабельности издания существует некая вероятность публикации статей полных лукавства, заказных материалов и прочей откровенной «джинсы».
  • Сотрудники специализированных информационных и консалтинговых компаний, формирующие базы данных. В настоящее время имеются разнообразные многопрофильные коммерческие информационные и даже научные хранилища, куда поступают сведения из любых источников. Количество таких баз данных в Интернет постоянно увеличивается.
  • Многочисленные фирмы, организации и компании (юридические лица), создающие собственные сайты в Интернет. Тематика, достоверность и оперативность информации на них не поддается описанию. Здесь может быть что угодно, начиная от PR-кампаний известных фирм и заканчивая приглашением на спиритический сеанс, датированный позапрошлым годом.
  • Творения обычных граждан (физических лиц, выражаясь юридическим языком), создающих в Интернет странички о себе любимых, о своих интересах, хобби, увлечениях или, на худой конец, рассказывающих о том, какой негодяй Василий Васильевич Васькин, их сосед по подъезду.
  • Наконец, информация, оставленная посетителями многочисленных Интернет-форумов, телеконференций или досок объявлений.

Из рассмотренной схемы видно, что в настоящее время Интернет — это универсальная среда, объединяющая большинство информационных ресурсов. Он выступает в качестве технического посредника по передаче информации, а также служит пространством хостинга, информационным полем, некой оболочкой, в которой могут безбедно существовать и развиваться как традиционные, так и ранее невиданные электронные СМИ и прочие информационные проекты. В последенее время появилось множество порталов. То есть в поисковых системах появляются ленты новостей, в электронных СМИ — возможность поиска информации, на сайтах информационных агентств — различные виды сервиса и т. д.



Теперь немного подробнее о некоторых информационных источниках. Наиболее достоверную информацию можно получить из информационного агенства, чаще всего в режиме реального времени

(он-лайн) т. к. их информация идет практически без комментариев, а выдает голые факты. Это известные агенства на мировом уровне:
  • Reuters (имеет огромный штат собственных корреспондентов собирающих новости по-всюду.);
  • китайское «Синьхуа»;
  • отечественное ИТАР-ТАСС;
  • американское Associated Press.
Нужно заметить так же, что есть разные информационные агентства. Одни собирают информацию сами и имеют огромный штат собственных журналистов, другие частично собирают сами, а частично заимствуют у других, третьи только заимствуют новости у других информ-агенств.

ИТАР-ТАСС и «Интерфакс» представлено большое количество интересной и полезной информации, но, к сожалению, свободно доступны лишь заголовки, тексты же сообщений платные (для подписчиков).

Информация от агентств «Новости», «Финмаркет» в отличие от предыдущего случая, доступна всем желающим и практически не уступает по полноте и качеству. Если в жестком режиме on-line особой нужды нет, можно подобрать окольные и малозатратные пути получения данных. Для систематизации этой информации лучше использовать Оракл или хотя бы Cronos. Следопыт, Clio.

По каким критериям собирать информацию зависит от ваших нужд. Одни считают, что много информации никогда не бывает, нужно лишь уметь ее структурировать, другие — отбирают только самое необходимое, по текущим проектам.

Обычно разделяют центральные и региональные, традиционные и электронные, специальные и развлекательные СМИ. С точки зрения наблюдателя в Интернет, это деление весьма условно. Большинство традиционных газет и журналов имеют свои интернет-серверы (порталы). Их содержание и информационная насыщенность не уступает большинству СМИ с многолетним опытом работы. Поэтому очень скоро СМИ, представленные в Интернет, можно будет классифицировать только по степени ангажированности и возможности поиска в архивах газетных публикаций.

Во многом способ подачи материала в СМИ зависит от взглядов его владельца. Вопрос этот, прямо скажем, достаточно деликатный и тонкий, истинное положение вещей в этой сфере весьма изменчиво, а значительная часть вообще скрыта от глаз стороннего наблюдателя. Тем не менее, некоторые данные, например список СМИ Газпрома можно увидеть на их сайте Газпром-медиа

При проведении мониторинга СМИ можно пользоваться неким алгоритмом действий. Начинать подготовку к поиску следует с лексического анализа имеющейся информации — с выявления слов, которые обычно употребляются при описании исследуемого объекта. Источниками на этом этапе могут стать специальные справочники, публикации СМИ, собственный опыт или советы экспертов.

После этого формируется набор ключевых слов — отдельных терминов, словосочетаний профессиональной лексики, клише. По возможности создается список ключевых слов с учетом семантических отношений между ними, так называемый тезаурус. Стоит предусмотреть синонимы, омонимы и морфологические вариации, ключевых слов. Эта работа продолжается в процессе поиска, и по мере выявления новых терминов они добавляются в тезаурус. Стоит заранее подумать о лингвистическом материале, необходимом при уточнении запросов, — редких словах, названиях и фамилиях, тесно связанных с проблемой. Желательно предвидеть, какие из выбранных терминов могут привести к появлению в отклике на запрос излишних документов.

Из ключевых слов, в соответствии с правилами, принятыми в конкретной поисковой системе, формируются запросы. Грамотное составление запросов — очень важный этап и подходить к нему надо исходя из возможностей поисковых систем.

Перед тем как проводить анализ полученных данных, информацию следует оценить и отсортировать по достоверности (подтверждаемая, правильная, сомнительная, не правдоподобная и т. п.) и по степени оперативности (история вопроса, состояние на сегодня, прогноз). Если нет возможности проверить достоверность информации, то косвенно о ней можно судить по надежности источника (абсолютно надежный, обычно надежный, довольно надежный и т. п.).

Информация может быть разной значимости. Различают информацию стратегического уровня, необходимую для принятия решений, определяющих развитие бизнеса, — открытие нового производства, внедрение на рынок нового товара или услуги и т. п. Она нужна, чтобы сориентироваться на рынке и определить перспективы, обнаружить еще не заполненные конкурентами рыночные ниши. Оперативно-тактическая информация отражает текущие проблемы. Например, строительство или приобретение зданий под новый цех, обучение персонала для выпуска новой продукции или оказание новой услуги.

При анализе информации из средств массовой информации следует учитывать, что они в той или иной форме выражают интересы своих хозяев. Если в странах с устоявшейся демократией и определенной политкорректностью владельцы СМИ вмешиваются в редакционную политику только в крайних случаях (например, во время войн и выборов), то в России, к сожалению, пресса может контролироваться даже по мелочам. Не стоит преувеличивать «независимость» журналистов. Они вынуждены подстраиваться под «хозяина», и материалы, ими написанные, могут подвергаться редакторской правке. «Независимость» источников лучше всего оценивать по принадлежности к конкретной финансово-промышленной группе или коммерческому банку.

Однако если информация подтверждается источниками из различных конкурирующих группировок, то, скорее всего, она достоверна. В информации открытого доступа, особенно компрометирующего характера, есть и правда, и доля вымысла. Естественно, что всему написанному верить не следует. Существует вероятность сознательной дезинформации. Необходимо в первую очередь выявить мотивы, которыми могут руководствоваться ее авторы. Читая статью, нужно проанализировать не только излагаемые в ней факты, но и понять личное отношение журналиста к излагаемой проблеме. Особое внимание следует обратить на личность журналиста, его связи, контакты, репутацию в деловых и политических кругах. Во многом этому помогает хотя бы приблизительное знание принадлежности издания к конкретным финансово-промышленным группировкам, несмотря на то, что ангажированная линия может проводиться достаточно тонко.

Анализируя материалы предвыборных кампаний если рассмотреть публикации «за» и «против», факты поддержки того или иного кандидата различными личностями, фирмами и общественными организациями, то при продуманной их обработке выстраиваются весьма любопытные схемы. Особенно хорошо это применимо в регионах, где вопросам оперативного легендирования уделяют значительно меньше внимания, чем в центре. Так, выявление взаимосвязей предвыборных штабов кандидатов и партийных списков позволяет заранее определить возможные группы «поддержки» той или иной коммерческой фирмы в органах законодательной или исполнительной власти.

Чтобы получить полезные знания из имеющихся фактов, необходимо выполнить аналитическую обработку собранной информации. Как правило, найденный текстовый фрагмент в отдельности не имеет самостоятельного значения, но объединенный вместе с другими дает более-менее ясную картину происходящего. Максимальное раскрытие содержания возможно из сопоставления информации с данными прошлых лет или сведениями из других источников. Важно выяснить причины и следствия исследуемых явлений и определить направление развития ситуации.

Обычно считается, что исследовательская информация — это осмысленные сведения, основанные на собранных, оцененных и истолкованных фактах, изложенных таким образом, что ясно видно их значение для решения какой-либо конкретной задачи. В том случае, когда трудно получить подтверждение достоверности, требуется умение трезво судить о вещах и пытаться приходить к правильным выводам на основе недостаточных данных.

Задача аналитика, готовящего исследование для будущей PR-кампании, состоит именно в том, чтобы не создавать мифологемы, а угадывать новые тенденции в потоке событий.

Изучая конкурентов, нам также понадобятся личные данные руководителей компаний — как правило, известны фамилия, имя и отчество лица, год рождения и паспортные данные, но иногда возникает потребность найти все остальные данные, насколько это возможно. Эта задача вполне успешно решается многократным обращением к разнообразным поисковым системам и базам данных — адресным, телефонным, базам данных регистрационных палат различных городов, пенсионным базам и т. д.

Весьма полезным бывает исследование периодической печати и сайтов Интернет. В последнее время появляется все больше сайтов типа «Кто Есть Кто» в регионе, творческой среде, отрасли промышленности или иной сфере деятельности.

Например, Справочник персоналий российской власти, сайты «Кто Есть Кто в Красноярском крае» или «Кто Есть Кто в Республике Башкортостан». Обычно в результате такой работы появляется биография и хронологическая подборка публикаций СМИ, раскрывающая характер и сферы деятельности объекта изучения. Особое внимание следует уделять анализу интервью и пресс-конференций, так как там мы имеем дело непосредственно с «прямой речью» исследуемого лица.

Технология сбора создания справки о информации о фирмах, компаниях, отраслях промышленности, фирме во многом аналогична правилам формирования биографий. Обычно сначала известно только название и адрес фирмы. При решении этой задачи в основном используются базы данных регистрационных палат, рекламные публикации, информация СМИ и любые иные сведения, которые могут оказаться полезными.

Особое внимание следует обратить на возможную негативную информацию в СМИ. Хотя большая часть таких публикаций имеет заказной характер и является делом рук конкурентов и их черного PR, в ней все же может присутствовать информация о реальных фактах, хотя даже ложно интерпретированная и претенциозно поданная. Все это может послужить основой для постановки задачи при перепроверке и подтверждении информации.

Могут полезными быть «деловая история» предприятия или финансово-промышленные группы, в которые оно входит, его учредители и соучредители, дочерние предприятия. Важно очертить круг причастных к фирме лиц и убедиться в отсутствии криминала. Очевидно, что для этого требуется неоднократное решение предыдущей задачи, а именно сбор информации о менеджменте среднего и верхнего звена.


Сведения об истинном положении дел на предприятии
Например, отсутствие или наличие заказов, потеря или приобретение кадрового потенциала, регулярность выплаты зарплаты, схемы, по которым она производится (легальная, полулегальная, в «конверте» и т. п.), закладные, штрафы, решения судов и т. п. Желательно дать информацию об имевших место претензиях со стороны налоговой инспекции, налоговой полиции, управления внутренних дел. Очень хорошо, если удастся привести сведения экономического характера.

Для этих целей удобно использовать специализированные системы, предоставляющие экономическую информацию, например СКРИН или СПАРК-ИНТЕРФАКС. Система СПАРК-ИНТЕРФАКС — эта одна из крупнейших, а может быть, самая крупная онлайновая база такого рода в Интернет. Она содержит информацию практически по всем зарегистрированным в России юридическим лицам, включает данные, предоставляемые Государственным комитетом по статистике, Министерством по налогам и сборам РФ Федеральной комиссией по рынку ценных бумаг России и др. В ее базах данных имеются реквизиты компаний, сведения об их руководстве, совладельцах, структуре компании, выпусках ценных бумаг, статистическая и финансовая отчетность, адаптированная для фундаментального анализа. С ее помощью можно получить описание деятельности компании и планов ее развития, информацию о событиях, судебных решениях. Система ориентирована на проведение оперативной комплексной оценки финансового состояния фирм и предприятий. Она позволяет найти основных производителей, потенциальных покупателей различных видов товаров и определить долю рынка, ими занимаемую, взаимосвязи между компаниями и т. п.

Результаты поиска доступны для дальнейшего анализа в виде сводного отчета. Все отчеты можно вывести на печать или экспортировать в файл MS Excel. Не стоит игнорировать публикации рейтинговых агентств и аналитических центров, занимающихся анализом экономической ситуации. Весьма полезными могут оказаться специализированные каталоги. Например, при сборе информации об автомобильной промышленности России можно воспользоваться каталогом Автопром.


Информация о политической или общественной организации
Данный вид документа формируется преимущественно по базам данных Минюста, регистрационных палат и публикациям СМИ, освещавшим деятельность организации. Особенно эффективно для этих целей использование региональной печати.

Весьма полезной может оказаться информация непосредственно с сайтов политических партий или общественных организаций. В последнее время, все больше и больше российских компаний обзаводятся собственными корпоративными сайтами, на которых размещают достаточно большой объем постоянно обновляемой информации, о своей деятельности, сведения об обязательствах компании, текущие новости, связанные с деятельностью фирмы. Анализ информации такого рода может оказаться необходимым, к примеру, при решении вопроса о спонсировании какой-либо общественной организации.

Контент-анализ источников информационных баз данных интернет-СМИ лучше всего проводить при помощи системы «Галактика-ZOOM». Система с помощью встроенных в нее функций оперативно отражает главные темы отобранных из базы данных публикаций. Напомним, что в автоматическом режиме можно найти:
  • список главных тем для каждого временного диапазона;
  • общий список главных тем;
  • общие главные темы, присутствующие во всем исследуемом временном диапазоне;
  • список уникальных главных тем, соответствующих только строго определенному месяцу.
Каждая из перечисленных возможностей предоставляется как для наиболее характерных слов, так и для словосочетаний. В результате контент-анализа отобранных публикаций система выдает таблицы слов и соответствующих им весовых коэффициентов К, отражающие их «смысловую важность» в текстах документов с точки зрения системы. Далее в процессе обработки данных система строит графики изменеий этих коэффициентов во времени.

Еще одна экспертная система, позволяющая проводить контент-анализ «ВААЛ» с ее помощью можно формировать тексты, обладающие заданным воздействием на целевую аудиторию. Кроме того, она может анализировать уже имеющиеся тексты на предмет их эффективного влияния на читателей, позволяет судить об авторах и многое другое. По утверждению разработчиков, система оценивает искренность автора, соответствие текста заявляемым задачам коммуникации, коммуникативную и эмоциональную эффективность текста.

Демонстрационную версию с описанием можно получить в Интернет по адресу: http://www.vaal.ru/prog/free.php В основе данного проекта лежит ряд основополагающих принципов:
  • выбор вариантов при написании текстов зависит от психологических особенностей человека, поэтому, анализируя устную или письменную речь, можно составить адекватное представление о внутреннем мире и системе ценностей человека (или группы лиц), готовивших тексты;
  • в ситуации свободного выбора человек лучше воспринимает тексты (устные или письменные), соответствующие его собственной картине мира, и склоиен игнорировать другие варианты описания;
  • эффективность воздействия текста сильно зависит от неких слабых или даже неосознаваемых эффектов, значимых для человека конкретной культуры слов, различных фоно- и цветоассоциаций и даже невербальных элементов.
Систему можно использовать для психиатрического, психоаналитического, мотивационного, эмоционально-лексического, фоно-и цветосемантического анализов. позволяет не только оценивать тексты на фоносемантическом уровне, но и целенаправленно создавать их с вектором воздействия, настраиваться на имидж соперников и подготавливать информационные материалы.

Очень многое может рассказать анализ Интернет-ресурсов созданных конкурентами. Изучение сайтов логично начинать с сайта официального регистратора доменных имен Ру-центр.
Поисковые средства этого сайта позволяют выделить все домены, зарегистрированные на имя той или иной компании. Результаты такого поиска могут оказаться богатым материалом для анализа — как стратегии развития компании, так и ее отношения к конкурентам. Например, известны случаи, когда компании «перехватывают» названия продуктов и услуг своих конкурентов и первыми заводят соответствующие адреса в Интернете.


Анализ контента сайта
Посмотреть, как используется сайт и какое целевое сообщение он доносит до своей аудитории. Использует ли компания рекламу в баннерных сетях, и если да, то каким образом и где именно? Принимает ли компания рекламные баннеры других сайтов? Если да, то каким образом размещается реклама: через баннерообменные сети или, что интереснее, через партнерские программы с другими сайтами (например, сайтами клиентов или поставщиков)? Используемые ключевые слова и методы продвижения на первые места в Интернете (используются ли серые методы раскрутки, такие как doorways, redirect и др.)

Есть различные сервисы типа PRQ. Этот сервис выполняет анализ и позволяет получить статистику по любому интернет-ресурсу и о методах продвижения сайта в сети:
  • тИЦ Яндекса, PR Google, Aport ИЦ.
  • Ссылки на анализируемый сайт по версии разных поисковых систем.
  • Счетчики, установленные на сайте. Быстрый доступ к их статистике.
  • Meta-поля (title, keywords, description) на странице и многое другое.
Следующая область исследований — ссылки, ведущие на другие сайты. На какие именно сайты выводят эти линки? Клиентов, поставщиков, партнеров? Почему они там? И, напротив, можно проверить, какие сайты имеют ссылки, приводящие на данный сайт (такую опцию поиска содержат некоторые поисковые машины, например AltaVista). Сопоставление данных о входящих и исходящих ссылках может привести к пониманию внутренних взаимосвязей между разными компаниями и их Интернет-проектами.

Важный индикатор перспектив компании в области электронного бизнеса — использование тех или иных технологий при изготовлении вэб-сайта. Некоторые проекты могут говорить о небольшой вовлеченности маркетинговых служб в процесс разработки сайтов: многие из них до сих пор делаются начинающими вэбдизайнерами, которые больше сосредоточены на технических находках, чем на идейной части проекта.

Очень важно проанализировать структуру и программную часть сайта. Например, многие сайты используют технологию JavaScript, но это относительно несложный код. На многих сайтах, кроме того, можно найти упоминания об авторах и дизайнерах сайта. Все это — ключ к определению возможного Интернет-бюджета. Большинство дизайнеров на сегодняшний день использует мета-теги. Их можно увидеть, открыв Интернет-страницу в виде tхt-файла. Таким образом можно понять, как сайт выстраивает свое продвижение в сети Интернет. Иногда можно увидеть очень распространенное явление: многие компании включают имена своих конкурентов в содержание мета-тегов, предназначенных для поисковых машин. Это делается в расчете на то, что пользователь Интернета, в поиске сайта конкурента, попадет на сайт компании.


Анализ использованных изображений

Например, некоторые сайты очень насыщены изображениями, что, безусловно, влияет на время загрузки. Для некоторых целевых групп это важный фактор. Анализируя эти данные, можно предположить, насколько хорошо дизайнер понимает потребности целевой аудитории, которая придет на сайт.

Объявления об открытых вакансиях размещенные на самом сайте или специализированных порталах по трудоустройству. Иногда их появление может указывать на расширение компании и ее переход к принципиально новым сферам деятельности. Кроме того, спецификация должностей — это намек на внутреннюю структуру компании.

Кстати, на тематических порталах по трудоустройству можно определить, не ищут ли работу бывшие сотрудники компании. Эти люди могут стать ценными источниками информации.

Вообще-то, социологический анализ кадровой политики компаний всегда был важной частью исследования конкурентов, но Интернет сделал эту задачу гораздо более простой для выполнения. Некоторые сайты выводят часть своих страниц из открытого доступа. Для изучения всего ресурса целиком существуют такие программные обеспечения, которые позволяют скачать сайт полностью на свой компьютер. Например, при помощи программы Teleport Pro.

Все эти исследования помогут понять реальную ситуацию в конкурентной среде, сделать выводы о свободных нишах, о перспективах развития конкурентных компаний и определиться с направлениями собственных задач. Исходя из детальной проработки ситуации складывается стратегия будущей PR-кампании, а так же прогнозирование отношения к ней и реакции конкурентных фирм.


[1] Конкурентная разведка в Интернет/ В. В. Дудихин, О. В, Дудихина. — 2-е изд., испр. и доп. — М.: ООО «Издательство ACT», Издательство «НТ Пресс», 2004
[3] www.cronos.ru
[4] www.gazprom-media.com
[5] vlast.rambler.ru
[6] www.ktos.snet.ru
[7] personabasnkortostan.org
[8] skrin.ru
[9] spark.interfax.ru
[10] www.avtoprom.ru
[11] Королько В. Г. Основы паблик рилейшнз. М.: «Рефл-бук», К.: «Ваклер», 2001
[12] vaal.ru
[13] Конкурентная разведка в Интернет/ В. В. Дудихин, О. В, Дудихина. — 2-е изд., испр. и доп. — М.: ООО «Издательство ACT», Издательство «НТ Пресс», 2004
[14] prq.ru

Источник: ekatika_project