Чтение онлайн

на главную - закладки

Жанры

Раскрутка: секреты эффективного продвижения сайтов

Костин Евгений

Шрифт:

5. В результате анализа, если обнаружена высокая доля совпадения контрольных сумм двух документов, делается вывод о том, являются ли эти документы четкими (контент полностью совпадает) или нечеткими (контент претерпел некоторые изменения) дубликатами.

Конечно, алгоритм мы продемонстрировали лишь в общих чертах, чтобы дать представление о принципе поиска дубликатов методом шинглов.

Поисковики используют и другие сложные методы проверки текстов на уникальность. Среди них – статистический анализ частотности слов с использованием распределения

Ципфа для поиска аномалий, наложение длинных пассажей (более длинных, чем шинглы, отрывков текста) для поиска совпадений в документах, которые подверглись ручному рерайту с разрушением шинглов, и другие методы.

Таким образом, избежать санкций поисковиков за использование чужого контента можно, лишь создавая оригинальный контент – самостоятельно ли, с привлечением ли копирайтера или рерайтера, способного качественно преобразовать заимствованный текст.

Семантическая разметка страниц

Индексируя страницы сайта, поисковый робот первым делом извлекает из них информацию. Чем более четко и организованно она подана «посланцу» Google или «Яндекса», тем быстрее и точнее он решит эту задачу.

На быстроту и корректность сбора данных для индексации влияет так называемая семантическая разметка страницы. Такое форматирование веб — документа призвано преподнести контент поисковику в предельно понятном, «съедобном» виде. Страница без семантической разметки будет так или иначе интерпретирована роботом, но ему придется самостоятельно структурировать извлеченную из нее информацию. А поскольку алгоритмы поисковых систем неидеальны, при отсутствии помощи со стороны сайтовладельца им не всегда удается безошибочно трактовать материалы и обеспечивать безупречный поиск по ключевым запросам.

Зато благодаря «семантической паутине», охватывающей все больше интернет — площадок, поисковики оказываются в состоянии давать пользователям точно и внятно сформулированные ответы на их запросы.

Микроформаты и микроданные

Семантическая разметка страницы осуществляется по специальным стандартам. Исторически сложилось так, что два гиганта поиска – Google и «Яндекс» изначально придерживались каждый своего формата. Разработчики из корпораций Google, Yahoo! и Microsof создали проект под названием Schema.org. Он основан на разметке с помощью тегов microdata («микроданные»). «Яндекс» присоединился к инициативе западных коллег осенью 2011 года, а до того начал продвигать в массы другую методологию – «микроформаты» (h p://microformats.org/wiki).

Очевидным образом веб — мастеров мягко подталкивают к тому, чтобы они прибегали к семантической разметке страниц. Администраторам сайтов в Рунете ради повышения привлекательности сайта для «Яндекса» и Google нужно учитывать оба формата и составлять две версии семантического описания контента.

Вот пример описания продукта с применением формата microdata:

(div itemscope itemtype="http://schema.org/Product")

(span itemprop="name")Микроволновая

печь Samsung MW73VR(/span)

(img src="samsung — microwave — mw73vr.jpg" alt='Микроволновая печь Samsung MW73VR' />

(div itemprop="aggregateRating" itemscope itemprop="http://schema.org/AggregateRating">

Средняя оценка покупателей (span itemprop="ratingValue">4(/ span>

на основе (span itemprop="reviewCount">11(/span>отзывов(/div>

(div itemprop="offers" itemscope itemtype="http://schema.org/ Offer">

(span itemprop="price">2630 р.(/span>

(link itemprop="availability" href="#" />В наличии

(/div>

(span itemprop="description">Отдельностоящая микроволновая печь объемом 20 л и мощностью 800 Вт(/span>

(div itemprop="reviews" itemscope itemtype="http://schema.org/ Review">

(span itemprop="name">Отличная печка(/span> – от (span itemprop="author">Иван(/span>,

(meta itemprop="publishDate" content="2012 — 04 — 01">1 апреля 2012

(div itemprop="reviewRating" itemscope itemtype="h p:// schema.org/Rating">

(meta itemprop="worstRating" content = "1">

(span itemprop="ratingValue">4(/span>/

(span itemprop="bestRating">5(/span>stars

(/div>

(span itemprop="description">Легко чистить(/span>

(/div>

(/div>

Формат microformats hProduc «Яндекса» на текущий момент используется поисковиком для описания автомобилей в программе «Отзывы по автомобилям». Пример разметки микроформатами приведен на странице помощи в сервисе «Яндекс. Вебмастер» (http:// help.yandex.ru/webmaster/?id=1113265).

Насколько верна семантическая разметка с использованием микроформатов на вашем сайте, легко проверить соответствующим валидатором в «Яндекс. Вебмастере» (http:// webmaster.yandex.ru/microtest.xml).

CMS с поддержкой микроформатов

Для работы с большим количеством страниц рациональнее обеспечить семантическую разметку инструментами CMS. Среди готовых решений, которые поддерживают микроформаты, – Drupal, Wordpress, Movable type. Под «самописную» CMS придется создавать специальный модуль со сходной функциональностью.

Важно помнить, что предназначение семантической разметки – помочь поисковику проанализировать и структурировать созданный для посетителя и видимый ему контент. Любое отклонение от курса (например, попытка упорядочить скрытый текст и другие сомнительные элементы) может быть расценено как нарушения правил поисковой системы и грозит наложением санкций на ресурс вплоть до «пессимизации».

Семантическая разметка – это мало того, что большой шаг к улучшению результатов поиска, но и средство, делающее прозрачнее отношения между сайтами и поисковыми системами. А значит, процедура в равной мере коммерчески и «гигиенически» значимая.

Поделиться:
Популярные книги

Личник

Валериев Игорь
3. Ермак
Фантастика:
альтернативная история
6.33
рейтинг книги
Личник

Золушка вне правил

Шах Ольга
Любовные романы:
любовно-фантастические романы
6.83
рейтинг книги
Золушка вне правил

Сколько стоит любовь

Завгородняя Анна Александровна
Любовные романы:
любовно-фантастические романы
6.22
рейтинг книги
Сколько стоит любовь

Невольница князя

Мун Эми
Любовные романы:
эро литература
5.00
рейтинг книги
Невольница князя

Солнечный корт

Сакавич Нора
4. Все ради игры
Фантастика:
зарубежная фантастика
5.00
рейтинг книги
Солнечный корт

Князь

Шмаков Алексей Семенович
5. Светлая Тьма
Фантастика:
юмористическое фэнтези
городское фэнтези
аниме
сказочная фантастика
5.00
рейтинг книги
Князь

Старое поместье Батлера

Лин Айлин
Фантастика:
историческое фэнтези
5.00
рейтинг книги
Старое поместье Батлера

Чужбина

Седой Василий
2. Дворянская кровь
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Чужбина

Часовое сердце

Щерба Наталья Васильевна
2. Часодеи
Фантастика:
фэнтези
9.27
рейтинг книги
Часовое сердце

Вторая жизнь Арсения Коренева книга третья

Марченко Геннадий Борисович
3. Вторая жизнь Арсения Коренева
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Вторая жизнь Арсения Коренева книга третья

Архонт

Прокофьев Роман Юрьевич
5. Стеллар
Фантастика:
боевая фантастика
рпг
7.80
рейтинг книги
Архонт

Имя нам Легион. Том 4

Дорничев Дмитрий
4. Меж двух миров
Фантастика:
боевая фантастика
рпг
аниме
5.00
рейтинг книги
Имя нам Легион. Том 4

Развод с миллиардером

Вильде Арина
1. Золушка и миллиардер
Любовные романы:
современные любовные романы
5.00
рейтинг книги
Развод с миллиардером

Лучший из худших-2

Дашко Дмитрий Николаевич
2. Лучший из худших
Фантастика:
фэнтези
5.00
рейтинг книги
Лучший из худших-2