Профессиональный поиск в Интернете
Шрифт:
Результаты такого поиска пока неоднозначны. Простейшая «рожица» позволяет исправно получать галерею портретов, белый круг на черном фоне – фотоснимки Луны. В то же время попытки изобразить деревце или еще что-нибудь более детальное ведут пока к серьезному разброду в результатах. Для получения хорошего результата нужно рисовать крупными мазками, не пытаться изображать мелкие детали, а постараться передать общий колорит.
Что интересно, пользовательские наброски сохраняются и им присваиваются собственные URL-адреса, которые можно сохранить или отправить по электронной почте. Кроме того, на сайте имеется галерея набросков, уже сохраненных в системе, причем при желании можно проголосовать за понравившиеся. Эта информация используется для совершенствования алгоритмов системы.
Второй
Выводы и рекомендации
Основными системами поиска изображений в Сети остаются универсальные поисковики и специализированные фотохостинги. Универсальный поиск силен широким охватом, но страдает от информационного шума. Наилучшие результаты он дает тогда, когда изображение можно явно и однозначно описать в текстовом виде, после чего остается надеяться, что веб-мастера не упустили этот момент при верстке своих страниц. Каталоги обеспечивают высокое качество тематического поиска, но «закрывают» далеко не все тематические ниши. Поскольку индексные базы изображений у крупных поисковиков отличаются, при серьезном поиске желательно задействовать несколько машин.
Экспериментальные контентные поисковики сейчас в основном работают с «низкоуровневыми» характеристиками изображений – цветом, формой, текстурой, в то время как человек, глядя на картинку, воспринимает цельные образы, причем способность к такому восприятию во многом опирается на приобретенный жизненный опыт. У машины такой школы нет, и это является причиной многих неточностей при поиске. Пользователю при составлении запроса, так или иначе, приходится учитывать специфику «машинного» восприятия изображения и переводить искомые образы на язык характеристик понятого машине уровня. Ориентация на словесное описание изображений в «традиционных» поисковиках при всех своих недостатках позволяет «зацепить» эти тонкие аспекты за счет прямого или косвенного участия человека в распознании содержимого картинки.
Пользовательский CBIR-поиск еще в самом начале пути. Большинство поисковиков открытого доступа находятся в стадии бета-версий. Экспериментальные машины поиска изображений занимают нишу специфических запросов и вряд ли готовы полностью заменить обычные поисковики и каталоги, ориентированные на использование ключевых слов. В то же время новейшие «контентные» технологии становятся прекрасным дополнением к «традиционным» способам индексации и поиска. Действительно: наиболее гибкими и удобными оказываются сервисы, объединяющие различные подходы к поиску: по ключевым словам, по тегам, по визуальным характеристикам изображений. Это, скорее всего, будет ведущей тенденцией ближайшего будущего. Возможности поиска изображений по косвенным признакам и проставленным пользователями тегам на универсальных поисковиках и фотохостингах все активнее дополняются технологиями контентного поиска.
Примерами могут служить рассмотренные в этой главе сервисы Google Картинки и Яндекс.Картинки. Возможности составления запросов у этих проектов сопоставимы, разве что Google распознает больше оттенков, в то время как. Яндекс предлагает более совершенные инструменты для работы с текстом запроса. Новые инструменты поиска и фильтрации изображений у обоих проектов достигли хорошего уровня. Механизмы распознавания лиц и поиска изображений по цветовой гамме функционируют четко и приносят реальную пользу. По количеству результатов выигрывает Google, однако результаты выдачи
Что касается интерфейсов просмотра, то здесь однозначного лидера выделить трудно. На стороне Google – удобная боковая панель с быстрым доступом к фильтрам и «бесконечная лента» выдачи. В активе Яндекса – чрезвычайно удобная опция группировки одинаковых изображений, а также информативная страница просмотра, позволяющая увидеть изображение без перехода на исходную веб-страницу.
Глава 8
Поиск видео
Интернет-поиск видеофайлов, как и поиск изображений, можно вести различными способами. Значительная часть видеоконтента в современной. Сети сохраняется на многочисленных видеохостингах, наиболее крупным и известным из которых остается YouTube. Среди таких ресурсов можно найти как универсальные по своему содержанию хостинги, так и тематические хранилища, например, специализирующиеся на документальном и образовательном видео или же сугубо развлекательном контенте. Соответственно, первый доступный вариант поиска нужного видеофайла – использование собственных поисковых систем соответствующих видеохостингов.
Поскольку таких ресурсов достаточно много, возникает уже знакомая нам ситуация: если пользоваться для поиска только каким-либо одним ресурсом, неизбежны потери, поскольку не существует ресурса, содержащего сведения обо всем сетевом видео. Решение данной проблемы также известно: создание систем поиска, способных работать с различными видеоресурсами.
Многие универсальные поисковики предлагают собственные вертикальные индексные базы видео. Как правило, в первую очередь они охватывают принадлежащие поисковикам видеохостинги или же несколько крупных видеоресурсов. Кроме того, существует группа специализированных видеопоисковиков как универсального, так и тематического характера. Такие поисковики зачастую обладают оригинальными интерфейсами и хорошим выбором специализированных инструментов составления запросов и просмотра результатов. Именно такие машины – вертикальные базы универсальных поисковиков и специализированные поисковые машины – являются главными героями данной главы.
Вертикальные базы универсальных поисковиков
Вертикальные видеобазы крупных универсальных поисковиков являются одним из наиболее популярных инструментов поиска сетевого видео. На руку таким базам играет и сам факт интеграции видеопоиска с другими инструментами крупных машин. Все-таки шансы выше на то, что пользователь, обратившийся к Google для поиска видео, просто переключится на другую вкладку, чем шансы его перехода к внешнему видеопоисковику.
Возможности универсальных поисковиков в части поиска видео примерно одинаковы, поэтому мы расскажем об их общих чертах, а также остановимся на различиях некоторых конкретных реализаций. Сервисы Google Видео и Яндекс Видео выбраны за широкий охват источников и хорошие результаты поиска русскоязычных видеофайлов. Проект Bing Видео интересен, в первую очередь, своим интерфейсом, который может оказаться весьма удобным для многих пользователей. Это, конечно, не единственные универсальные поисковики, предлагающие поиск видео, однако именно они способны, в основном, удовлетворить повседневные требования к такому поиску.
Как и в предыдущей главе, посвященной поиску изображений, мы проведем сравнительное тестирование вертикальных баз универсальных поисковиков. Тестировать видеопоиск мы будем примерно по аналогичной методике: в качестве теста будет использован одинаковый запрос на русском языке. Все поисковики будут работать в «чистом» режиме, без входа в персональные аккаунты и с отключенными «семейными» фильтрами.
Упомянем еще одну популярную возможность поиска видео: с помощью торрент-трекеров и всевозможных ресурсов, хранящих видеофайлы на файловых хостингах. Поскольку поиск видео на таких ресурсах принципиально не отличается от поиска файлов других типов, данный способ подробно рассматривается в главе 9.