Как оформить сайт, чтобы он попал в ТОП?
С начала эры оптимизации и до сегодняшнего момента произошло значительное изменение в степени влияния внешних и внутренних факторов на результаты поиска. Если раньше достаточно было внешних ссылок на сайт (различных по весу и значимости, но это уже другая история), то сейчас намного бОльшее значение приобретают факторы внутренние, и именно о них мы поговорим в данной статье.
Ранжирование документов Яндексом
Первоначально перед ранжированием документов происходит препроцессинг запроса. Препроцессинг (или «переколдовка») – это установка эмпирически подобранных контекстных ограничений. В настоящий момент отмечается тот факт, что контекстные ограничения в нем практически отсутствуют.
Более того, контент документа и анкор-файлы объединены в одну поисковую зону.
Среди нововведений в последнее время можно отметить более широкое добавление к формам слова других, таких как однокоренные, перевод, транслит, синонимы и расшифровки аббревиатур. В основном встречаются переводы на английский и украинский языки.
Следующий момент при ранжировании – фильтрация по кворуму (определение релевантных пассажей).
Многие читали Яндекс на РОМИП 2004, где Илья Сегалович расписал принципы выдачи поисковой системы. Эта формула работала до 2007 года, пока все могли видеть переколдовку.
Сергей Людкевич в своем докладе на конференции NetPromoter «Внутренние факторы, влияющие на индексацию и ранжирование» указывает на то, что при наличии 6 тяжёлых лёгкий кворум уже не проходит.
Для прохождения кворума необходимы 6 тяжёлых запросов из 7. Раньше такого не существовало, нужно было меньшее количество тяжёлых слов для прохождения кворума. Это даёт основание полагать, что неполные пассажи практически кворум не проходят. Возможно, он отошёл от той модели, которая освещалась в его докладе в 2004 году.
Другой важный момент – текстовое ранжирование. В теории информационного поиска (informational retrieval) известен такой подход, как tf*idf. Что под этим подразумевается? Оценивается вес отдельных слов по отношению к запросу, а затем из суммы этих весов собирается вес страницы. Как правило, idf – логарифм обратный частоте терминов коллекции. Под tf подразумевается нормирование числа вхождений леммы в документ (TF). И зная эту нормировку, мы можем выбирать стратегию расположения числа и плотности ключевых слов при составлении максимально релевантного. Выделяется два вида нормировки: 1) по длине документа и 2) по частоте самого частотного термина.
Если рассматривать нормировку по длине, то здесь важно количество слов, входящих в документ. То есть получается, что чем он длиннее, тем ниже релевантность. Перед оптимизатором стоит задача сделать как можно больше вхождений терминов в документ, но при этом обеспечить его наименьшую длину, т.е. необходимо наращивать плотность. В таком случае получается, что идеальная плотность стремится к 100%, однако поисковые системы накладывают на такие страницы с подозрительно высокой плотностью специальные санкции. В качестве примера приводится формула из доклада на РОМИП-2006: tf=TFнорм=TF/(TF+k1+k2*DL), где к1=1, k2=1/350.
Нормировка по частоте самого частотного термина использовалась в 2006-2007 гг. и была установлена по методике Миныча. Пример: tf=TFнорм=TF/max (7, TFmax).
Сергей Людкевич предполагает, что в настоящий момент идёт нормировка по длине документа. При этом он утверждает, что тег - нет. Поисковые системы по разному учитывают форматирование текста и зоны документа. Тэг и не учитываются ни в одной из вышеназванных ПС. Атрибут alt тега учитывается в Google, в Рамблере – полные слова, входящие в первые 60 символов, а в Яндексе вовсе не учитывается. Что касается URL документа, то в Яндексе и Google он учитывается, а в Рамблере – нет.
В завершении Сергей даёт несколько простых советов:
- Страница должна быть по возможности наилучшим ответом на конкретный запрос.
- Самые высококонкурентные целесообразно привязывать к главной странице.
- Идеальный вариант: 1 страница = 1 запрос.
- Перед копирайтером нужно ставить задачу писать большой текст с большим количеством ключевиков.
Получается, сколько усилий приложишь во время работы, такая и будет отдача. Поэтому лучший совет – не лениться при работе над страницами сайта! Лучше10 раз отмерить и 1 раз отрезать, чем остаться совсем без клиентов.
Оставить комментарий
Комментарии:
Повторение никогда не помешает, спасибо)))
Ну получается, чтобы сделать хороший ресурс надо изначально подобрать ключевые слова, и уже под них начать его делать. При этом еще необходимо учесть требования ПС? Ну это реально очень сложно. Да и я не думаю, что тот же Тема Лебедев так делает, они просто клепают и все.