Интернет-разведка. Руководство к действию
Шрифт:
Ну, и не стоит забывать, что бесплатные ресурсы могут перестать быть бесплатными или вовсе убрать информацию с сайта. Первое можно увидеть на примере ресурса Public.ru, который долгое время баловал пользователей открытым доступом к документам в своей базе данных, после чего сделал его платным. Примерно та же ситуация порой складывается и с некоторыми журналами, которые пару недель позволяют читать информацию в бесплатном доступе, а затем переносят ее в архив, откуда ее можно получить уже только за деньги.
Второе прослеживается на примере страниц с новостями, которые нередко просто стирают и записывают на освободившееся место свежие материалы, при этом далеко не всегда сохраняя стертое в архиве.
Интересно, что бывает и обратный процесс – когда платные
Сравнение платных и бесплатных ресурсов, по Helen Burwell, [26] приведено в табл. 3.
26
Burwell H. P. Online Competitive Intelligence: increase your profits using cyber-intelligence. – Facts on Demand Press, 1999.
Таблица 3 Сравнение платных и бесплатных ресурсов.
Артур Вайс [27] приводит такое сравнение платных и бесплатных ресурсов Интернета (табл. 4).
Таблица 4
Преимущества платных и бесплатных сетевых ресурсов.
Как искать в Интернете информацию о конкретных людях
27
Weiss A. Secondary Source Information // Материалы тренинга на Десятой Европейской конференции SCIP, Лондон, 2005 г.
В русскоязычном Интернете информация о людях может быть найдена либо с помощью поисковых систем, либо с помощью телефонных онлайн-справочников.
В информационные системы вводится запрос, который должен содержать фамилию и варианты написания имени и отчества. Дабы исключить возможное взаимное недопонимание с реальным человеком, на примере которого будет объясняться эта разновидность поиска, обратимся к запросу данных о Ющуке Евгении Леонидовиче.
Для того, чтобы составить такой запрос сначала требуется указать все варианты написания его имени. Варианты написания имени Ющука Евгения Леонидовича могут быть следующими:
Ющук Евгений Леонидович, Ющук Евгений, Ющук Е., Ющук Е. Л.
а также в иной последовательности:
Евгений Леонидович Ющук, Евгений Ющук, Е. Ющук, Е. Л. Ющук.
Некоторые специалисты иногда включают в запрос и такое написание имени, как:
Евгений Л. Ющук.
Поскольку слово «Ющук» всякий раз повторяется, а имя или инициалы расположены непосредственно рядом с фамилией, то для Яндекса подобный запрос, позволяющий поставить на мониторинг информацию об этом человеке, может выглядеть следующим образом:
[+ющук /1 +(евгений | «евгенй леонидович» | «е.л.» | «е»)]
Затем из результатов поиска исключается информационный «мусор».
Важно, что при этом следует выбирать слова, которые с небольшой вероятностью могут встречаться в документах, имеющих отношение к искомой личности. Особенно важно соблюдать это правило, когда слово исключается из всего документа, а не из предложения. Проблема в том, что при изучении человека,
Мы бы рекомендовали в такой неопределенной ситуации прием, который доказал на практике свою эффективность. При получении в выдаче документа, вызывающего сомнения, не надо в поиске слов для исключения ограничиваться сниппетами. Советуем открыть весь материал и поискать слова для исключения непосредственно в его тексте. Напомним, что сниппеты – это те несколько строк, которые приводятся в результатах запроса для того, чтобы помочь исследователю сориентироваться в содержимом документа. Неопытные пользователи забывают о возможности открыть материал и пытаются из сниппетов, которые находятся у них перед глазами, выудить такие слова – и совершают ошибку.
Так, например при поиске по указанному поисковому запросу по Ющуку Евгению Леонидовичу в сниппеты попадает такой текст:
«… Генерал-майор.? 6549. ЧЕРТОК. Абрам. Гершанович. Генерал-майор артиллерии.? 6550…».
На первый взгляд, логично удалить с помощью логического «НЕ» слово «генерал». Однако в принципе возможно появление документов, где Ющук Е. Л. упоминается вместе с этим словом. Например, в предыдущей нашей книге «Конкурентная разведка: маркетинг рисков и возможностей» указано, что ее научный консультант – генерал Службы Внешней разведки России в отставке Ющук Ростислав Васильевич. И хотя на момент написания книги в Интернете этой информации не было, нельзя отказываться от вероятности ее появление в принципе. Таким образом, если исключить из выдачи документы, содержащие слово «генерал», результаты будут неполными, потому что это слово все-таки достаточно распространено в обыденной речи.
Во избежание подобной ситуации, мы и рекомендуем не ограничиваться прочтением нескольких строк сниппетов, а открывать текст документа и искать в нем слова, которые при их удалении, вероятнее всего, не приведут к потере информации об исследуемом человеке. Универсального рецепта здесь не существует, решение зависит от того, какой конкретно вопрос исследуется.
Так, выяснилось, что в документе, который содержал сниппеты:
«.. Генерал-майор.? 6549. ЧЕРТОК. Абрам. Гершанович. Генерал-майор артиллерии.?
6550…», —
после его открытия оказался, в частности, такой текст:
ФЕДЮНИНСКИЙ Иван Иванович Генерал армии
ФЕДЮНЬКИН Иван Федорович Генерал-майор
ФЕДЮНЬКИН Иван Федорович Генерал-лейтенант
ФЕКЛЕНКО Николай Владимирович Генерал-майор танковых войск
ФЕКЛЕНКО Николай Владимирович Генерал-лейтенант танковых войск
ФЕЛЬДМАН Моисей Исаакович Генерал-майор технических войск
На наш взгляд, в данном случае правильнее было бы исключить документы, содержащие в любом месте текста слово «ФЕДЮНЬКИН» или «ФЕКЛЕНКО». Это относительно редкие фамилии, поэтому с высокой степенью вероятности можно предположить, что их удаление из результатов поиска не приведет к отрицательным последствиям. Однако если потребуется убедиться в том, что это действительно так, можно сделать проверочный запрос:
[+ющук && +фекленко]
В результате было найдено два сайта, имеющих отношение к человеку по имени И. И. Ющук. Подобная проверка лишний раз доказала, что слово для исключения из выдачи было выбрано верно, по крайней мере, на момент составления запроса. С этой точки зрения, кстати, подошло бы и слово «Гершанович», которое присутствовало в сниппетах, но часто бывает так, что в них не оказывается редко употребляемых слов и для иллюстрации решения проблемы мы дали здесь более развернутые рекомендации и примеры.