Раскрутка: секреты эффективного продвижения сайтов
Шрифт:
Такие тесты помогают решить, достаточно ли мощностей виртуального хостинга для стабильной работы сайта, или же требуется подыскать для него более «прочную» платформу.
2. Виртуальный выделенный сервер (VDS). По производительности на ступеньку выше виртуального хостинга. Отличается способностью принимать большее количество посетителей. На сервере размещаются не тысячи, а лишь десятки ресурсов. К плюсам VDS относятся оптимальная стоимость услуг и наличие выделенной площадки с доступом ко всем настройкам и программному обеспечению.
3. Выделенный сервер (dedicated). В пользование клиенту предоставляется отдельный мощный компьютер, который физически размещается в дата — центре хостера. Арендовать такой
4. «Облачный» (кластерный) хостинг. Оптимальное решение для средних и достаточно крупных проектов с переменной нагрузкой на сервер. Особенность «облачного» хостинга в том, что он может обеспечить бесперебойную работу сайта даже при резком увеличении аудитории, причем владелец площадки платит только за потребляемую процессорную мощность. Решение подходит ресурсам, для которых характерна периодически возрастающая активность посетителей.
Правила переноса сайта на другой хостинг
Каждый серьезный хостинг — провайдер предоставляет пользователям подробные рекомендации по переносу сайта на свою площадку. Отсутствие каких бы то ни было инструкций ставит под вопрос качество хостинга. Стандартная схема переноса сайта и домена состоит из следующих этапов.
1. Создается резервная копия всех файлов сайта и базы данных.
2. В аккаунт на новом хостинге копируются директории и файлы сайта. При необходимости создается база данных.
3. Проверяется работоспособность всех систем сайта.
4. Создаются ящики электронной почты на сервере нового хостера.
5. Вносятся изменения в NS — записи через панель управления регистратора (если домен регистрировался через него), или отправляется запрос на изменение записей в техподдержку хостинг — провайдера (если домен регистрировался через хостера).
6. Выполняется контрольная проверка работы сайта с акцентом на правильной отправке сообщений (путем заполнения формы на сайте, оформления товара через «Корзину» и т. д.) и корректной загрузке файлов. Также необходимо протестировать работу доменов третьего уровня и ниже при наличии таковых.
7. Делается резервная копия сайта с нового хостинга.
Подводя итоги, отметим, что основная работа по переносу сайта заключается в замене прежних NS — записей новыми, а также в сохранении контроля над управлением доменом после отключения аккаунта у старого хостинг — провайдера.
Проверка уникальности контента методом шинглов
Уникальный, качественный, ласкающий глаз и не взрывающий мозг контент – краеугольный камень SEO — продвижения. Контент должен быть представлен либо авторскими текстами, либо рерайтом, сделанным с чувством, с толком, с расстановкой. Обмануть поисковую машину и всучить ей чужой текст, перекроенный с помощью синонимайзера, вряд ли удастся, поскольку посредством специальных алгоритмов она умеет распознавать такую подмену.
Знание того, каким образом работают алгоритмы, проверяющие тексты на уникальность, полезно тем, кто занимается текстовым наполнением сайтов. Предупрежден – значит вооружен.
Метод шинглов
Ежедневно поисковый робот индексирует многие миллионы документов. Если бы для обнаружения дублей поисковой машине требовалось сопоставить между собой все существующие документы (каждый с каждым), ей пришлось бы произвести миллиарды миллиардов операций.
На помощь поисковой машине были привлечены математика и лингвистика. Для сравнения огромного количества документов в базе поисковика применяется так называемый метод шинглов. Он крайне трудоемок, но современные компьютеры с ним справляются. Детально концепцию описывает опубликованная в апреле 1997 года статья «Синтаксическая кластеризация в Сети» (Syntactic clustering of he Web) авторства А. Бродера, С. Глассмана, М. Манассе и Г. Цвейга, которая вошла в сборник трудов Шестой международной конференции World Wide Web.
Алгоритм поиска дубликатов
В переводе с английского shingle означает «гонт». Яснее не стало? Гонт – это кровельный материал, а точнее, небольшие дощечки с пазами и выступами, которые собираются в один лист. Применительно к поисковым системам шинглы – это алгоритм для поиска дубликатов путем вычисления и сопоставления контрольных сумм выборки канонизированных (см. значение термина ниже) словосочетаний длиной от одной до десяти (приблизительно) единиц. Работает это следующим образом.
1. Все слова в тексте приводятся к исходным словоформам, стоп — слова (предлоги, союзы, частицы, знаки препинания и другие незначимые и не несущие смысловой нагрузки элементы) удаляются. Это называется канонизацией текста. Таким образом получается исходник для вычисления шинглов. Более жесткая канонизация может учитывать синонимы и, например, исходное слово «недомогать» заменять на «болеть». Это помогает выявлять тексты, где лишь некоторые исходные слова заменены близкими по смыслу
2. Канонизированный текст делится на фразы длиной от трех до десяти (примерно) слов. Разбивка осуществляется или встык, или внахлест, когда в последующую фразу включено одно или несколько последних слов из предыдущей. Малейшее изменение канонизированного текста – и возникают совсем другие шинглы. Чтобы конструкция не разрушилась как карточный домик, в тексте нужно задать четкие, но малоочевидные точки отсчета для членения на шинглы. В качестве примера приведем схожий алгоритм «Яндекса» под названием «Спамооборона», где устанавливаются границы, цитата: «от буквы “ю” до буквы “ю”; или от двухбуквия, сумма численных значений символов (букв) которого кратна 50, до следующего такого же».
3. Далее для каждого шингла вычисляется контрольная сумма (точнее, применяется хэш-функция). Проще говоря, последовательность слов превращается в последовательность цифр.
4. Затем формируется выборка шинглов, вернее, контрольных сумм и непосредственно сравнение и анализ документов. Из всех полученных контрольных сумм отбирается несколько десятков значений. Производится это путем случайной выборки, к примеру, 70 математических функций из заблаговременно составленного реестра, каждая из которых может описывать интересный для целей data mining параметр: пересечение, вложенность и т. д. Все шинглы документа пропускаются через каждое из 70 выражений, что дает на выходе значения, атрибутируемые тому или иному шинглу. Для каждой из 70 функций выбирается шингл с минимальным (возможны и иные критерии) значением контрольной суммы. В результате на базе анализируемого документа составляется сигнатура из 70 значений контрольных сумм. При сравнении с другим документом, который подвергся такой же операции, берутся шинглы, отобранные по совпадающим функциям. К примеру, если при отборе шинглов в обоих случаях было использовано 25 одинаковых функций из 70, то сравнение выполняется по 25 соответствующим контрольным суммам.