Профессиональный поиск в Интернете
Шрифт:
Поисковик Exalead демонстрирует хорошие результаты поиска ресурсов на европейских языках. Несложно самостоятельно убедиться, что, допустим, при поиске по одинаковому запросу на итальянском языке Exalead заметно выигрывает у Google как по широте охвата веб-ресурсов, так и по степени глубины их индексации. Тестовый поиск французских и немецких ресурсов не позволяет выявить однозначного лидера: в зависимости от запроса вперед может выйти и Exalead, и Google. В англоязычном поиске сильнее оказывался Google.
При выборе универсального поисковика важную роль играет качество находимых с его помощью ресурсов. Определить предпочтительный для конкретных задач поисковик можно «методом маркера». Суть его состоит в том, что вначале составляется некий тематический поисковый запрос, после чего опрашивается группа людей-экспертов в данной области на предмет выявления лучших, по их
Эту схему вполне может применить и частный пользователь. Поскольку далеко не у всех под рукой имеется группа экспертов, основная проблема заключается в определении сайтов-маркеров. Для ее решения можно проанализировать разделы полезных ссылок, часто встречающиеся на тематических сайтах. Найдя действительно серьезный тематический ресурс по интересной вам теме, загляните в такой раздел – там вы найдете ссылки, отобранные энтузиастами своего дела, что позволит выявить сайты-маркеры, а приводимые в таких разделах описания ресурсов являются хорошими заготовками для конструирования тестового запроса.
Глава 2
Вертикальный поиск
Важным направлением развития современного интернет-поиска стало появление большого количества специализированных поисковиков, предназначенных для углубленного поиска определенного тематического контента. Такие интернет-машины часто называют «вертикальными». Среди таких проектов можно найти немало полезных ресурсов.
Вертикальные поисковики удачно дополняют универсальный интернет-поиск. Если вы интересуетесь какой-либо определенной тематикой и нашли соответствующий специализированный поисковик – можете принимать поздравления: эффективность поиска заметно возрастет. Улучшение качества поиска достигается за счет обращения в первую очередь к заранее отобранным тематическим ресурсам. Это позволяет значительно уменьшить количество информационного шума в списке выдачи Кроме того, сортировка результатов поиска зачастую производится с учетом особенностей тематического контента. Исключительно заметной разница универсального и вертикального вариантов поиска становится в ситуациях, когда у ключевых слов запроса есть синонимы в других областях. Простейший пример такого запроса – слово «библиотека», которое может иметь различное значение в зависимости от контекста. Это может быть и реальное учреждение, и сетевое собрание электронной литературы, и компонент компьютерного приложения. Многие вертикальные машины обладают дополнительными алгоритмами обработки запросов, учитывающими наличие сленга, аббревиатур и других тонкостей, так или иначе присущих конкретным тематическим областям.
Необходимо заметить, что вертикальные поисковики являются хорошей альтернативой тематическим порталам, снабженным собственными системами поиска. В популярных тематических нишах таких порталов немало, и для того чтобы составить полную информационную картину той или иной темы, пользователю приходится немало поработать. Рано или поздно возникает естественное желание получить некий общий поисковик, который позволил бы собрать в едином интерфейсе информацию с нескольких ценных ресурсов. Другими словами, мы опять приходим к идее вертикального поисковика.
В этой главе рассматриваются три группы вертикальных поисковиков. Это специализированные учебные и научные поисковики, особенно актуальные для читателей, получающих образование или повышающих квалификацию. Этим же читателям, надеемся, будут полезны сведения о системах поиска в сетевых электронных библиотеках. Дополняет картину рассказ о специализированных поисковиках компьютерных программ. Эта задача универсальна и время от времени возникает у большинства пользователей.
Научный интернет-поиск
Современные универсальные системы интернет-поиска не самым лучшим образом приспособлены для поиска научной информации. В результате поиск научных публикаций с их помощью становится достаточно сложной задачей. Решить ее с максимальной эффективностью помогут специализированные научные поисковики, которые являются разновидностью вертикальных машин интернет-поиска. Сейчас можно найти немало таких машин, в основном отраслевого характера. Кроме того, на современном информационном рынке
Академия Google
Когда же может потребоваться обращение к такому специализированному научному поиску? Типичные ситуации – подготовка рефератов, курсовых и других учебных работ. Представим себе студента, которому нужно подготовить такую письменную работу. Скачивать готовую курсовую – низкий класс, тем более что по узким темам готовых рефератов немного, соответственно, они хорошо известны всем, в том числе и преподавателям. Да и пользы от таких рефератов для самого студента – ноль, разве что время экономится. Итак, наш герой принимает правильное и максимально полезное для качества своего образования решение: работать самостоятельно. Первый этап подготовки любой учебной работы – поиск источников по теме. Вполне логично использовать для этих целей не только традиционные, но и интернет-источники. Однако при обращении к сетевым источникам возникает несколько проблем, главная из которых – проблема оценки качества найденных публикаций. Если искать обычными универсальными поисковиками, то отличить первоисточник от «перепева» или банального плагиата очень сложно. Кроме того, никто не дает гарантии, что приводимая информация не была искажена. Специализированный поисковик ограничит поиск только заранее отобранными ресурсами, содержащими качественную информацию. Проведем практический эксперимент и отправим одинаковые запросы в универсальном поисковике Google и в Академии Google. Тестовым ключевым словом выступит «абиогенез» – одна из концепций современной биологии, описывающая происхождение живой материи из неживой. Первые две страницы выдачи «обычного» поисковика Google будут заняты ссылками на краткие статьи словарей и энциклопедий с редкими вкраплениями предложений скачать рефераты по близким темам. Список выдачи Академии Google с первых же страниц полностью состоит из ссылок на научные и научно-популярные статьи, материалы конференций и разделы книг по теме запроса. Поскольку рядом с каждым материалом приводятся сведения о его цитируемости в других работах, это позволяет достаточно быстро найти основные работы, с которыми, по всей видимости, стоит ознакомиться в первую очередь.
Давайте подробнее познакомимся с возможностями и инструментами Академии Google. Бета-версия данного сервиса под оригинальным названием Google Scholar стартовала в октябре 2004 года. Академия Google индексирует ресурсы открытого доступа, интернет-сайты, а также издательские сервисы, предоставляющие доступ к публикациям на коммерческих условиях. Кроме того, научный поисковик Google развивает программу интеграции с электронными каталогами классических (офлайновых) научных библиотек. Данная программа предназначена для библиотек, располагающих онлайновыми электронными каталогами, поддерживающими формат OpenURL. Подключение библиотек к научному проекту Google свободное и бесплатное. В зависимости от настройки сервера библиотеки просмотр каталога может предоставляться как всем желающим, так и только зарегистрированным пользователям библиотеки. Русскоязычная версия Академии Google по умолчанию поддерживает поиск по электронному каталогу Государственной публичной научно-технический библиотеки (ГПНТБ). При настройке механизма поиска пользователь может добавить до трех собственных ссылок на онлайновые каталоги библиотек, поддерживающих названные технологии.
Интерфейс поисковика выдержан в строгом стиле и предлагает не так много дополнительных инструментов. К средствам быстрой фильтрации результатов отнесем, разве что, хронологическое меню, позволяющее переходить к просмотру публикаций определенного года выхода. Если публикация была найдена на нескольких ресурсах, то в результатах поиска появится ссылка для просмотра полного списка копий такого материала. При оценке релевантности той или иной ссылки, влияющей на ее позицию в списке выдачи поисковика, учитывается индекс цитирования публикации и ее автора, а также известность интернет-источника или издания, опубликовавшего статью (рис. 2.1).