Профессиональный поиск в Интернете
Шрифт:
При серьезном целенаправленном сборе информации в Сети часто возникает необходимость сохранения полезных ссылок или веб-страниц для дальнейшей работы. Результатом, кроме собственно полезного эффекта, становится стремительно растущий размер архивов на жестком диске. И если емкости современных дисков позволяют несколько свысока смотреть на проблему нехватки пространства, сортировка такого беспорядочного архива и поиск в нем стандартными средствами становятся настоящей головной болью.
Решать данную проблему можно различными способами. Все современные браузеры предлагают встроенные средства для работы с закладками, однако их функциональности хватает только для обслуживания относительно небольших архивов. Задачу поиска среди сохраненных веб-страниц
Программы для метапоиска в интернете
Несмотря на кажущееся разнообразие выбора, пик популярности подобных приложений, похоже, позади. Большинство представленных в Сети локальных программ для интернет-поиска было создано в начале двухтысячных годов, многие не обновлялись с 2003–2005 года. Учитывая постоянные изменения поискового «ландшафта», польза от применения таких «старичков» представляется весьма сомнительной. Далее мы уделим внимание только последним решениям, которых не так много.
Современные программы для поиска в интернете значительно различаются по функциональности. Среди них есть как относительно простые приложения, оснащенные разумным минимумом функций, так и достаточно сложные решения, которые, по большому счету, являются локальными аналогами вертикальных тематических интернет-поисковиков. Такие приложения предлагают метапоиск среди большого количества специализированных поисковиков и интернет-ресурсов. Их ценность состоит именно в наличии больших каталогов ресурсов и возможности точного тематического поиска по узким запросам.
FirstStop WebSearch
Программа FirstStop WebSearch размещает свое поле для быстрого поиска прямо на рабочем столе Windows. Бесплатная версия программы предлагает только два тематических раздела поиска: в Сети в целом и в сервисах социальных закладок. Количество встроенных поисковиков невелико. Это компенсируется тем, что FirstStop WebSearch позволяет добавлять в базу собственные поисковики, причем определять переменные и форматировать строку запроса предлагается вручную – на сайте программы есть даже небольшая шпаргалка о том, как это делать. Предусмотрено автоматическое обновление базы поисковиков в соответствии с заданными пользователем параметрами. Кроме того, списки поисковиков можно импортировать и экспортировать вручную.
Оригинальная особенность данного приложения – кластеризация результатов. Панель Discovery Tree демонстрирует все автоматически выделенные программой ключевые слова, что позволяет быстро перемещаться по результаты поиска. К сожалению, быстрое исключение кластеров из результатов поиска не предусмотрено, что не дает эффективно фильтровать результаты. Для этой задачи служит отдельный инструмент, позволяющий отбирать страницы по заголовку, нашедшему ссылки поисковику и другим признакам (рис. 11.1).
Рис. 11.1. Поисковик FirstStop WebSearch
Результаты поиска можно сохранить и выгрузить в файл. Для дополнительной обработки результатов предлагается использовать сторонние программы – предусмотрена интеграция с пакетами Web Finalist и Monarch Search. Из полезных дополнений
Copernic Agent
Copernic Agent остается, пожалуй, самым известным приложением для метапоиска в интернете. Существуют три версии приложения: Basic, Personal и Professional. «Базовая» версия бесплатна, однако обладает урезанной функциональностью. Мы рассмотрим наиболее мощную «профессиональную» версию. Это приложение обладает достаточно серьезными возможностями поиска и дополнительной обработки результатов.
Оценка одной из основных характеристик любого решения для мета-поиска – охват интернет-поисковиков – в Copernic неоднозначна, хотя заявлена поддержка нескольких сотен поисковиков и онлайновых справочников, разбитых на тематические и национальные группы. Каждая категория содержит до нескольких десятков поисковых ресурсов. Категории можно устанавливать и удалять, что напоминает работу с электронными словарями. При установке категории в списке поисковиков можно отобрать только нужные машины (рис. 11.2).
Рис. 11.2. Настройка поисковых категорий в программе Copernic Agent
Хотелось бы остановиться на национальных поисковых категориях Copernic. Предлагается десяток подборок для конкретных стран – от. Австралии до Индии. К сожалению, России здесь нет, наиболее близкое географически местоположение – Польша. Кроме того, предлагаются подборки поисковиков для работы с материалами на испанском, итальянском и французском языках. В этих блоках подобраны полезные поисковики, что делает Copernic хорошим инструментом для работы с некоторыми национальными сегментами Сети. Нельзя не отметить тематический поиск в новостях, блогах и таких полезных для специалистов источниках, как базы патентов. Перед таким массивом источников можно было бы только уважительно снять шляпу, если бы не пара неприятных нюансов, относящихся к наиболее универсальной и востребованной категории – простому веб-поиску.
Дело в том, что среди всех сотен источников и тринадцати поисковиков, включенных в универсальную категорию Web, не нашлось места для Google. Вероятно, для этого у разработчиков были свои причины, однако исключение одной из крупнейших индексных баз из результатов поиска заметно сказывается на качестве поиска и вызывает искреннее недоумение. Из включенных в данную категорию поисковиков более-менее приличные результаты по запросам на русском языке способны выдать только Bing и в меньшей степени Yahoo!. В принципе, если бы в Copernic были предусмотрены инструменты самостоятельного добавления описаний поисковиков, эта проблема не была бы серьезной. Однако программа позволяет только создавать собственные категории, которые можно комплектовать источниками из общей библиотеки Copernic.
Интерфейс Copernic Agent Professional состоит из области просмотра и двух вспомогательных панелей: боковой и верхней. Верхняя панель предназначена для работы с архивом проведенных поисков. Боковая панель содержит три вкладки. Вкладка Quick Search отвечает за работу в режиме простого поиска, а также позволяет выбирать категории для поиска. Вкладка Common Tasks содержит инструменты анализа найденного. Возможна фильтрация найденных материалов по различным признакам, автоматическое удаление дублей и «мертвых» ссылок. Кроме того, Copernic Agent умеет автоматически составлять небольшие рефераты. Правда, нормально работает данная функция только с англоязычным текстом, да и здесь чудес нет: нам предлагают выдержки из текстов найденных веб-страниц, содержащих автоматически найденные ключевые слова.