Профессиональный поиск в Интернете
Шрифт:
Рис. 3.2. Yippy является одним из самых мощных кластерных метапоисковиков
Процесс составления запроса здесь не отличается от «обычных» поисковиков. Все дополнительные инструменты уточнения запроса собраны на странице выдачи Кластеры, которые здесь называются «облаками» (Clouds), представлены на боковой панели в виде наглядного иерархического дерева. По умолчанию показывается не все дерево, а только корневые разделы, которые можно раскрывать щелчками мыши. В нижней части боковой панели находится поле быстрого поиска в найденных кластерах (Find in clouds). После отработки уточненного запроса все кластеры, в которых встречается дополнительный термин, получают цветную подсветку. Кроме
Форма расширенного поиска, вызываемая ссылкой Advanced, содержит фильтры языка и типа файлов и позволяет ограничить поиск конкретным сайтом или доменом.
В аннотациях к найденным ссылкам на странице выдачи Yippy показывается традиционная для метапоисковиков строка, сообщающая, в каких именно базах был найден данный документ и его рейтинг в этих системах. Удобная особенность Yippy – возможность предварительного просмотра найденных страниц в небольшом фрейме прямо на странице результатов поиска рядом со ссылками.
Весьма интересным получился раздел кластерного поиска в Википедии, который становится удобным средством поиска в случае, когда требуется не просто найти одну статью по конкретной теме, а охватить целиком некую предметную область. Выделяемые системой кластеры здорово экономят время, которое при обычном режиме поиска было бы затрачено на открытие и просмотр связанных статей из Википедии.
Отметим наличие в Yippy интерфейса, оптимизированного для мобильных устройств (m.yippy.com). Здесь кластеры группируются в виде горизонтальной линейки в верхней части страницы выдачи, а вместо строки фильтра появляется раздел Refine Query, предлагающий варианты уточнения запроса.
Системы «классического» метапоиска
Для полноты картины упомянем несколько метапоисковиков, не использующих в своей работе кластеризацию. Среди зарубежных «классических» метапоисковиков стоит назвать такие ресурсы, как Dogpile (www.dogpiLe.com) и Metacrawler (www.metacrawLer.com). Они основаны на одном алгоритме и работают с Google, Yahoo! Ask, LookSmart, About, FindWhat и некоторыми другими машинами. Полученные списки обрабатываются и сортируются по релевантности. «Классический» русскоязычный метапоиск наилучшим образом реализован в системе Metabear/Metabot. Получаемые данные дополнительно обрабатываются по собственному алгоритму. Работает поисковик сразу по двум адресам: на metabear.com расположена английская версия, а на metabot.ru – русская. Среди поддерживаемых поисковых машин и каталогов – Яндекс, Рамблер и Апорт.
При поиске через Metabot можно применять логические операторы и задать режим точного совпадения фразы. Излишне увлекаться данной возможностью не следует, поскольку используемые поисковики могут по-разному толковать одни и те же операторы, что может привести к неправильной трактовке запроса и ухудшению результатов поиска.
Что касается интерфейса, то здесь все выдержано в строгом стиле: ссылка, краткая текстовая выдержка из документа, перечень нашедших его поисковиков. Ключевые слова подсвечиваются цветом.
Кроме работы с веб-документами, система Metabot способна искать специфичные ресурсы: видеоклипы, музыкальные файлы и FTP-архивы.
Ixquick
Согласно некоторым статистическим подсчетам, обычный житель. Лондона за день попадает в объективы примерно трех сотен телекамер наблюдения. В. Нью-Йорке свободы побольше: там среднего жителя за день фиксирует всего двести камер. К этому очередному цивилизационному стандарту постепенно стремятся и другие страны. Сбежать от тотального наблюдения в виртуальное пространство становится все труднее, пресловутая сетевая анонимность, позволю себе скаламбурить, становится все более виртуальной.
Возможности отслеживания сетевой активности сейчас самые богатые. Даже если говорить только об интернет-поиске, можно отметить, что некоторые крупные поисковики сохраняют информацию о проводимых пользователями поисках. К счастью, на многих системах эта опция явно описывается
Система метапоиска Ixquick работает с десятью внешними базами. Это поисковики Bing, Yahoo! Ask, All the Web, Cuil, Entire Web, Gigablast, каталоги Qkport и Open Directory, а также Wikipedia. В списке баз отсутствует Google, однако охват альтернативных систем стоит признать достаточно широким, что делает данный метапоисковик весьма ценным ресурсом. Поддерживается поиск на восемнадцати языках, в том числе русском.
Ixquick предлагает три режима поиска: Ixquick Search, Power Search и Expert Search. В отличие от большинства других поисковиков, быстро сменить режим в ходе поиска не удастся. Для этого придется обратиться к странице настройки системы. Первый из названных режимов, по сути, является режимом простого поиска. С его помощью можно составить запрос, содержащий только какое-либо одно условие. Дополнительных фильтров и инструментов уточнения запроса здесь нет Power Search и Expert Search – это, фактически, два варианта расширенного поиска, отличающиеся количеством доступных возможностей поиска Power Search предлагает стандартные средства работы с логическими операторами: поиск с обязательным включением или исключением указанных ключевых слов, поиск любых слов, поиск точной фразы Expert Search, кроме этого, поддерживает поиск в заголовках страниц и тексте URL-адресов, ограничение поиска определенным доменом, а также позволяет находить сайты, ссылающиеся на указанную пользователем веб-страницу.
Рядом со строкой ввода запроса находится перечень задействованных в ответе на запрос поисковиков и каталогов. При необходимости можно исключить из списка выдачи результаты определенных машин щелчками на их значках.
Полученные от внешних источников результаты обрабатываются, и пользователю предлагается объединенный список уникальных результатов, найденных на различных поисковиках. Для определения релевантности результатов и, соответственно, их позиции в списке выдачи используются собственные алгоритмы Ixquick. Кроме того, на странице результатов поиска рядом со ссылками, которые были высоко оценены целевыми поисковиками, выводится их рейтинг в виде линейки «звездочек». Каждая звездочка означает, что какой-либо из поисковиков поместил эту ссылку на первые позиции в своем списке выдачи При наведении на них указателя мыши появляется всплывающая подсказка со сведениями о нашедших данную ссылку поисковиках и ее позиции в их списках выдачи В остальном страница результатов весьма проста: из дополнительных инструментов уточнения запроса присутствует только строка поиска в найденном, расположенная в нижней части страницы выдачи (рис. 3.3).
Рис. 3.3. Страница выдачи метапоисковика Ixquick
Ixquick может похвастаться некоторыми полезными функциями, демонстрирующими внимательное отношение разработчиков к вопросу приватности пользователей Ixquick предлагает сразу несколько инструментов повышения скрытности поиска и серфинга. Начнем с его способности выступать в качестве прокси-сервера. Рядом с каждой найденной ссылкой в списке результатов поиска находится ссылка Proxy. Щелчок на ней открывает целевой сайт в защищенном режиме, в котором Ixquick выступает в качестве посредника, скачивая запрошенную веб-страницу и выводя ее в собственном интерфейсе для просмотра. При этом внешний сайт не может узнать IP-адрес пользователя, сохранить его куки-файл или как-то иначе нарушить приватность просмотра. При переходе по ссылкам на найденной веб-странице все новые адреса также открываются с помощью прокси-сервера Ixquick. У защищенного режима Ixquick, конечно же, есть некоторые ограничения. В частности, отключаются присутствующие на веб-страницах скрипты, теряют работоспособность многие формы ввода данных. В то же время для обычного серфинга возможностей Ixquick вполне достаточно.