Чтение онлайн

на главную - закладки

Жанры

Шрифт:

Стоит отметить, что даже самые лучшие поисковые машины обрабатывают только вершину имеющегося в сети информационного айсберга. Поисковые роботы не могут просматривать закрытые для них коммерческие сайты, число которых в настоящее время приближается к миллиону. Эти сайты различны по содержанию (информация правительственная, законодательная, статистическая, научно-техническая, патентная, новостная и т. п.) и форме — например, сайты, содержащие видеоинформацию, музыкальные сайты.

Поиск нужной информации в данном случае осуществляется по следующему алгоритму: задается ключевое (поисковое) слово или фраза, и система ищет данное слово или фразу

в базе данных, автоматически составленной поисковой машиной на основе текстового содержимого исследуемых сайтов.

Имеющимися техническими средствами полностью формализовать процедуру поиска информации пока не представляется возможным. Из-за того, что до настоящего времени не существует стандарта на размещение информации в Интернете, реализовать сложную стратегию поиска часто бывает весьма затруднительно. Поэтому при ведении аналитической разведки средствами Интернета приходится идти по пути информационной избыточности, что накладывает весомые ограничения на релевантность найденных документов. Из-за высокого процента информационного шума в общем объеме найденных документов значительно увеличивается время, необходимое для аналитической обработки полученных сведений.

Следует отметить, что результативность поиска в данном случае зависит от двух составляющих.

Во-первых, от степени соответствия ключевого слова или фразы поставленной информационной задаче, т. е. релевантности информационного запроса.

Причем если по первому запросу поисковая система нашла слишком много документов, то по уже отобранному массиву можно провести второй поиск с заданием дополнительных условий и тем самым сузить круг выдаваемых документов. Эта функция очень проста в исполнении (нужно только запомнить предыдущую выборку) и реализована в большинстве популярных машин, включая российские «Яндекс» и «Рамблер».

Помимо этого в современных поисковых машинах — западные AltaVista и HotBot, российские «Яндекс» и «Рамблер» — существует (по крайней мере декларируется) функция интерактивного поиска («найти похожие»). Она также позволяет постепенно уточнить запрос: указать на один или несколько найденных документов и попросить найти документы, повествующие «о том же». Выполняется такой поиск путем превращения документа в поисковый запрос (естественно, с определенной степенью «сжатия», так как запрос слишком большим быть не может). Но нужно отметить, что работает эта функция весьма «капризно» — очень часто находит совсем не то, что ищешь.

Во-вторых, у каждой поисковой системы свой алгоритм поиска и перечень сайтов, входящих в базу данных поиска, поэтому при одном и том же запросе результаты поиска в различных поисковых системах могут значительно отличаться. Поэтому для чистоты эксперимента лучше всего последовательно «прочесать» информационное пространство Интернета при помощи нескольких поисковиков. При поиске информации о конкретных хозяйствующих субъектах или о целых экономических регионах особое внимание стоит уделить поиску официальных сайтов субъектов Федерации и муниципальных образований, где расположены объекты вашего оперативного интереса. При этом не стоит ограничиваться элементарным «скачиванием» заинтересовавшего вас документа. Стоит «обработать» весь сайт как следует. Это связано с тем, что очень часто на нем имеются ссылки на сайты местной торгово-промышленной палаты, средств массовой информации и т. д.

В качестве примера можно привести следующий случай, служба безопасности предприятия, собирая информацию в отношении предполагаемого

партнера в одном отдаленном субъекте Федерации посредством Интернета, вышла на официальный сайт данного субъекта Федерации. Официальная пресса, представленная там, расписывала возможного партнера, не жалея творческих сил и бюджетных средств. Но аналитики пошли дальше и через ссылку на официальном сайте администрации вышли на сайт торгово-промышленной палаты, а оттуда на сайт, посвященный местным СМИ. С данного сайта вышли на материалы одной из оппозиционных главе администрации региона газет и этим существенно расширили свои знания об исследуемом объекте на предмет имевшегося на него «негатива».

Еще один пример.

Службе безопасности банка поставлена задача в течение суток подготовить справку по крупному хозяйствующему субъекту, расположенному в весьма отдаленном субъекте РФ. Как назло, человек, который мог бы «подсветить» эту организацию, болеет. Выход из ситуации один — обойтись подручными средствами.

С помощью поисковой системы аналитики СБ сделали выборку разноплановых информационных документов, где упоминается данное предприятие, с различных сайтов. Отобранные документы были полностью скопированы на жесткий диск. Далее наступил черед анализа и синтеза.

Рассмотрим детально, что и как было использовано.

1. Фактографическая информация о предприятии была частично получена из нескольких источников — собственный сайт предприятия (история предприятия, его реквизиты, руководство, перечень необходимого сырья и производимой продукции, перспективные планы), сайт региональной Торгово-промышленной палаты, сайты областной и городской администрации.

2. Финансово-экономический блок — сайт Федеральной комиссии по ценным бумагам — ситуация с акциями (хотя и не всегда свежая), сайты информационных и консалтинговых фирм, а также средств массовой информации, исследующих экономические проблемы (например, журнал «Эксперт»), — так были получены баланс предприятия (который предприятие обязано опубликовать) и другие экономические показатели; на сайте местного отделения Министерства по налогам и сборам — информация о задолженности предприятия в бюджет.

3. Инвестиционная информация — на сайте областной администрации и на сайте консалтингового агентства была получена информация об инвестиционных программах предприятия.

4. Информация о перспективах развития — на сайте отраслевых журналов можно получить весьма интересные аналитические обзоры, причем в динамике всей отрасли.

5. Социально-политическая информация — сайты местных СМИ, как официальных, так и оппозиционных.

6. Информация о фирмах, работающих с ценными бумагами предприятия, с сайтов объявлений о продаже акций и векселей, что позволило в дальнейшем уже оперативным путем проследить связи выявленных фирм.

7. Персональная информация о руководстве — сайты местных СМИ и официальные сайты местных органов власти.

8. Компрматериалы — сайты местных и центральных СМИ, специальные «жареные» сайты.

Кстати, при правильном подходе даже официальные сайты предприятий могут сообщить вам очень много интересного.

Так, например, накануне большой отраслевой ярмарки одна из крупных западных компаний на сайте своего основного конкурента обнаружила информацию о массированной кампании по стимуляции своего товара. Это позволило вовремя переработать подготовленный к выставке прейскурант и лишить конкурента возможности сыграть на явном ценовом преимуществе.

Поделиться:
Популярные книги

Буревестник. Трилогия

Сейтимбетов Самат Айдосович
Фантастика:
боевая фантастика
5.00
рейтинг книги
Буревестник. Трилогия

Дворянская кровь

Седой Василий
1. Дворянская кровь
Фантастика:
попаданцы
альтернативная история
7.00
рейтинг книги
Дворянская кровь

Метатель

Тарасов Ник
1. Метатель
Фантастика:
боевая фантастика
попаданцы
рпг
фэнтези
фантастика: прочее
постапокалипсис
5.00
рейтинг книги
Метатель

Мастер Разума IV

Кронос Александр
4. Мастер Разума
Фантастика:
боевая фантастика
попаданцы
аниме
5.00
рейтинг книги
Мастер Разума IV

Проводник

Кораблев Родион
2. Другая сторона
Фантастика:
боевая фантастика
рпг
7.41
рейтинг книги
Проводник

Эволюционер из трущоб

Панарин Антон
1. Эволюционер из трущоб
Фантастика:
попаданцы
аниме
фэнтези
фантастика: прочее
5.00
рейтинг книги
Эволюционер из трущоб

Запрети любить

Джейн Анна
1. Навсегда в моем сердце
Любовные романы:
современные любовные романы
5.00
рейтинг книги
Запрети любить

Герцогиня в ссылке

Нова Юлия
2. Магия стихий
Любовные романы:
любовно-фантастические романы
5.00
рейтинг книги
Герцогиня в ссылке

Игра на чужом поле

Иванов Дмитрий
14. Девяностые
Фантастика:
попаданцы
альтернативная история
5.50
рейтинг книги
Игра на чужом поле

Санек 2

Седой Василий
2. Санек
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Санек 2

Невеста инопланетянина

Дроздов Анатолий Федорович
2. Зубных дел мастер
Фантастика:
космическая фантастика
попаданцы
альтернативная история
5.25
рейтинг книги
Невеста инопланетянина

Метка драконов. Княжеский отбор

Максименко Анастасия
Фантастика:
фэнтези
5.50
рейтинг книги
Метка драконов. Княжеский отбор

Зауряд-врач

Дроздов Анатолий Федорович
1. Зауряд-врач
Фантастика:
альтернативная история
8.64
рейтинг книги
Зауряд-врач

Никчёмная Наследница

Кат Зозо
Любовные романы:
любовно-фантастические романы
5.00
рейтинг книги
Никчёмная Наследница