Чтение онлайн

на главную - закладки

Жанры

Яндекс для всех
Шрифт:

Рейтинг фотографий проводится на основе независимого голосования пользователей за понравившиеся фотки. (Для голосования перейдите на страницу понравившейся фотографии и проголосуйте за нее.) На главной странице показывается первая десятка лучших фоток по мнению пользователей. При расчете рейтинга учитывается средний балл, количество голосов и время публикации (преимущество — у более свежих фоток). Также существует рейтинг "по комментариям", в котором учитывается количество новых комментариев к фотке.

Может встретиться и такая ситуация, когда вы посчитаете, что размещенная фотография должна относиться либо к разряду "фотка

для взрослых", либо она нарушает правила размещения фотографий на сервисе. Отправьте сообщение об этом модератору (со страницы фотографии). Если они посчитают жалобу обоснованной, то к разместившему ее автору будут приняты жесткие меры.

Если же фотография вам понравилась, и вы бы хотели разместить ее на своем сайте или блоге, Яндекс. Фотки также предоставят вам такую возможность. На странице фотографии (рис. 8.20) выберите подходящий размер и нажмите на ссылку код для вставки на свой сайт или дневник(ссылка размещена справа от фотки). Скопируйте его в появившемся окошке и вставьте без изменений в блог или на страницу сайта.

Поиск фотографий подобен поиску открыток. Здесь также на первой странице есть раздел Лучшие фотки, отобранные по результатам голосования, можно просматривать свежие фотографии, публикуемые на главной странице, можно перейти по ссылкам из "облака" меток, либо выполнить привычный поиск.

Хотя в момент написания этих строк сервис работал в тестовом режиме, в нем уже было опубликовано несколько сотен фотографий, и количество возрастало не по дням, а по часам.

Глава 9

Индекс цитирования

Задача пользователя поискового сервера заключается в том, чтобы как можно быстрее найти то, что ему требуется. Поисковый сервер также "желает" как можно лучше и быстрее решить эту задачу. Но при этом перед поисковиком стоит и вторая задача — "вытащить", поднять наверх документы, наиболее релевантные запросу. И как быть в том случае, когда тексты на нескольких страницах одинаковы или очень близки друг другу? Какую из этих страниц показывать вначале, а какие — следом? Что делать в том случае, когда опубликованную на уважаемом сайте статью разместил на своей персональной страничке никому не известный человек? Какая из этих страниц окажется в результатах поиска выше?

9.1. Как ранжировать сайты

Когда Интернет был еще "маленьким", для ранжирования сайтов (и документов, размещенных на них) в первую очередь использовались текстовые критерии. Основная задача разработчиков сайтов и тех, кто наполнял их контентом, состояла в правильной расстановке в различных частях кода ключевых слов. Способы находили разные — как размещение в коде невидимого для посетителя текста, так и написание текстов по специально разработанным методикам, учитывавшим специально рассчитанные "весовые" значения слов. С ростом Сети в дополнение к текстовым критериям добавлялись и так называемые ссылочные. Вот что об этом говорит в статье "Как работают поисковые системы" Илья Сегалович:

Прежде всего, стало очевидно, что поиск в вебе не может быть сколько-нибудь корректно выполнен, будучи основан на анализе (пусть даже

сколь угодно глубоком, семантическом и т. п.) одного лишь текста документа. Ведь внетекстовые (off-page) факторы играют не меньшую, а порой и большую роль, чем текст самой страницы. Положение на сайте, посещаемость, авторитетность источника, частота обновления, цитируемость страницы и ее авторов — все эти факторы невозможно сбрасывать со счета.

Появились эти критерии не на пустом месте. Для научных трудов вопрос значимости был давно решен за счет применения индекса цитирования (ИЦ). Индекс цитирования для научного труда определяется как количество ссылок на этот труд в других изданиях (иногда вместо ссылок на конкретный труд считают упоминания фамилии автора). Этот принцип определения значимости был перенесен и на веб-страницы, для которых ИЦ подсчитывается по количеству ссылок на нее с других веб-ресурсов. Для веб-сайта индекс цитирования определяется по ИЦ его страниц. Главная особенность такого ранжирования заключается в том, что значимость сайта определяется не его владельцем, а тем, как его оценивают другие — чем больше ссылок ведет на сайт, тем ценнее размещенная на нем информация.

Однако индекс цитирования в том виде, как он здесь описан, не дает корректной оценки значимости. Хотя бы потому, что зачастую одна ссылка с известного и уважаемого сайта может значить намного больше, чем сотня ссылок с никому не известных страниц. Поэтому был предложен более сложный вариант индекса цитирования — взвешенный (вИЦ). При его подсчете для каждой ссылки вычисляется вес в зависимости от того, на каком сайте она размещена. Чем авторитетнее сайт, тем выше вес ссылки, на нем размещенной. При подсчете взвешенного индекса цитирования почти все поисковые системы исключают из подсчета ссылки, размещенные на сайтах с бесплатного хостинга, на немодерируемых форумах, ряде иных ресурсов. Также не берутся в расчет внутренние ссылки (переходы со страницы на страницу в рамках одного сайта).

9.2. PageRank

Наиболее ярким примером такого индекса цитирования служит PageRank. Как описывает теорию индекса Google — "если Страница А ссылается на Страницу В, то Страница А считает, что Страница В — важная страница". Текст ссылки не используется при расчете этого индекса. Зато наоборот, PageRank оказывает влияние на важность ссылок на страницу. Если на страницу указывают многие важные ссылки, то ее ссылки на другие страницы также становятся более важными. Для PageRank важными ссылками считаются ссылки, ведущие на сайт из каталогов DMOZ и Yahoo!.

Базовая формула для расчета значения PageRank чаще всего в соответствующих статьях бывает представлена в следующем виде:

где:

PR a — PageRank рассматриваемой страницы;

d — коэффициент затухания (означает вероятность того, что пользователь, зашедший на страницу, перейдет по одной из ссылок, содержащейся на этой странице, а не попадет на следующий документ каким-нибудь другим образом);

Поделиться:
Популярные книги

Я тебя не отпускал

Рам Янка
2. Черкасовы-Ольховские
Любовные романы:
современные любовные романы
6.55
рейтинг книги
Я тебя не отпускал

Орден Багровой бури. Книга 3

Ермоленков Алексей
3. Орден Багровой бури
Фантастика:
фэнтези
попаданцы
5.00
рейтинг книги
Орден Багровой бури. Книга 3

Звезда сомнительного счастья

Шах Ольга
Фантастика:
фэнтези
6.00
рейтинг книги
Звезда сомнительного счастья

Прометей: каменный век II

Рави Ивар
2. Прометей
Фантастика:
альтернативная история
7.40
рейтинг книги
Прометей: каменный век II

Жнецы Страданий

Казакова Екатерина
1. Ходящие в ночи
Фантастика:
фэнтези
9.32
рейтинг книги
Жнецы Страданий

Враг из прошлого тысячелетия

Еслер Андрей
4. Соприкосновение миров
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Враг из прошлого тысячелетия

Громовая поступь. Трилогия

Мазуров Дмитрий
Громовая поступь
Фантастика:
фэнтези
рпг
4.50
рейтинг книги
Громовая поступь. Трилогия

Надуй щеки! Том 5

Вишневский Сергей Викторович
5. Чеболь за партой
Фантастика:
попаданцы
дорама
7.50
рейтинг книги
Надуй щеки! Том 5

Лэрн. На улицах

Кронос Александр
1. Лэрн
Фантастика:
фэнтези
5.40
рейтинг книги
Лэрн. На улицах

Комбинация

Ланцов Михаил Алексеевич
2. Сын Петра
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Комбинация

Стеллар. Заклинатель

Прокофьев Роман Юрьевич
3. Стеллар
Фантастика:
боевая фантастика
8.40
рейтинг книги
Стеллар. Заклинатель

Решала

Иванов Дмитрий
10. Девяностые
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Решала

Месть бывшему. Замуж за босса

Россиус Анна
3. Власть. Страсть. Любовь
Любовные романы:
современные любовные романы
5.00
рейтинг книги
Месть бывшему. Замуж за босса

Товарищ "Чума" 3

lanpirot
3. Товарищ "Чума"
Фантастика:
городское фэнтези
попаданцы
альтернативная история
5.00
рейтинг книги
Товарищ Чума 3