Продвижение сайта с помощью картинок

 

Положим, нашей задачей является продвижение сайта или бренда по картинкам. В данном случае нам необходимо понимать, как именно устроен этот алгоритм ранжирования в Яндекс.

Важно знать

При продвижении картинок в поисковых системах наиболее эффективно будет создать свою собственную уникальную иллюстрацию высокого качества и затем уже заниматься ее продвижением.

При этом в Google алгоритм будет аналогичным с тем отличием, что «картиночный» алгоритм поисковой системы Google на порядок лучше и качественней, чем у Яндекс.

Алгоритм определения дубликатов и оригинальных изображений в Яндекс.

Для того, чтобы искать дубликаты картинок, их необходимо классифицировать.

Чтобы посмотреть, как именно Яндекс ищет дубликаты, можно использовать полезную фичу в поиске по Яндекс.Картинкам – ставим «все копии» в поиске. Теперь посмотрим на практике.

Классификатор делит дубликаты на два вида
1.    Тумбнейлерные дубликаты – частичное видоизменение, уменьшенные копии на сайте, или кусок исходной иллюстрации.
2.    Полудубликаты – модификации одной и той же картинки.

Стадии кластеризации дубликатов
1.    Разбиваем множества изображений на сотни больших пересекающихся групп по дескрипиторам.
2.    Формируем группы в дубликаты по близости дескрпторов в небольшие множества ( берутся иллюстрации с большим количеством одинаковых дескрипторов).
3.    Финальная валидация – т.е. находим пересекающиеся множества и их проверяем на дубликаты. Происходит попарное сравнение. При этом хранятся только ключи и сигнатуры для изображений, но не сами оригиналы. На финальном этапе не используются полноразмерные изображения.

Алгоритм работы сравниваемых изображений
1.    Тумбнейлерные дубликаты ищутся с помощью обрезания рамки (выкидываются по 2 пикселя рамки с каждой стороны) и преобразования исходного изображения в черно-белые версии картинок.
2.    Если иллюстрации серьезно отличаются, то применим метод DOG (Difference of Gaussians filter), т.е. берется размытие изображения Гаусса с различным радиусом и разница размытия с разными радиусами дает области, которые устойчивы к этому размытию. Более подробно про метод можно почитать тут http://en.wikipedia.org/wiki/Difference_of_Gaussians

Благодаря этому методу алгоритм понимает, что является шумом на изображении, а что нет, т.е. можно определить значимые области. Надо понимать, что алгоритм DOG инвариантен к вращениям, поэтому поворот на 90 градусов и зеркаливание картинки метод не очень удачный для уникализации изображений.
Также в методе DOG происходит компенсация и яркости и контрастности, поэтому нет смысла при попытках уникализации использовать эти методы.
Благодаря использованию метода DOG совмещаются две области различных изображений, т.е. соотнося изображение по этим двум дескрипторам (область и масштаб). Результат этой итерации - область пересечения (также учитывается взаимное положение дескрипторов). Т.е. в итоге мы одинаково отмасштабировали сравниваемые области, а дальше происходит сам процесс сравнения.

Контентная составляющая картинок сайта при продвижении
1.    Важная задача – понять, что считается дубликатом, а что нет. Некоторые изменения можно считать, а можно нет, для этого необходим свой классификатор. Например, фотожабы, графики, скриншоты интерфеса и т.п. не будут являться дубликатами.
2.    Важно текстовое описание, т.е. с помощью описания можно предположить, что картинка с бОльшей степенью является уникальной, при сильной схожести контентной составляющей самой картинки. Т.е. смотрится и подпись и окружающий текст. В этом случае необходимо детерменировать правильное описание, т.е. определить степень правдоподобности описания. Чем больше копий, тем точнее описание и тем правильней можно определить смысл. При сопоставлении описаний имеет смысл делать множественные уточняющие описания одной и то же картинки, но на разных сайтах. При этом текстовое описание должно быть максимально близко к запросу, вводимому пользователем. Сам алгоритм ранжирования устроен таким образом, что страница, из которой можно взять наилучший сниппе и будет выбираться в качестве основной картинки, а остальные могут считаться дублями.
3.    Работа с контентом, это никак не тег alt, многие путают эти понятия.
4.    При разноразмерных вариантах с высокой долей вероятности будет лучше ранжироваться более крупная картинка, или более четкая.

Цитата

Результаты зависят от маркетинга и новых технологий, все остальное – издержки.

Питер Друкер (самый известный теоретик менеджмента)



Методы применимые для ранжирования картинок
1.    Кликовый фактор. Если на одну и ту же картику много раз кликнули, значит она более релевантна.
2.    Факотором ранжирования картинки является авторитетность сайта.
3.    Как уже говорилось ранее, качественный информативный сниппет для страницы с картинкой.
4.    Будет не плохо, если на картинку ссылаются несколько описаний.
5.    Если в рунете присутствует несколько дублей (лучше в виде ссылки на исходник) или измененные картинки (связей может быть множество, лучше если бОльшая часть веса идет на полноценную копию).
6.    Когда на нескольких авторитетных ресурсах лежит одинаковая копия картинки, значит эта картинка более значимая для пользователя, но необходимо, чтобы основной вес картинки был именно на нужном сайте.
7.    Ну и непосредственно ссылочный фактор, тоже дает ощутимое преимущество.
8.    По высококонкурентным высокочастотным запросам занижаются картинки использующие телефон и другие явные рекламные атрибуты.

Теперь перед Вами открыты все возможности, смело начинайте думать об эскизе настоящего шедевра – самой картинки. Если с этим туго, то можно «подкорректировать» чужое «произведения искусства»: всего пару нехитрых взмахов кистью – картинка уникальная и оригинальная!

Комментарии:

Natalia23.02.15 11:40

Я думаю, для правильной раскрутки сайта по этому способу, нужно иметь свои уникальные картинки.

Lori02.02.15 01:45

Продолжение. Картинка Фото1 всегда своя (уникальная).

Lori22.01.15 02:08

Скажите, плз, это дубль изо? 1. Я пишу новость - 1 абзац + фото1. Подробнее - переход на вложенную страницу этой новости, где дублируется первый абзац, далее идет уник текст (еще неск абзацев), дублируется фото1 Это плохо? ПС наказывает за это?

Я18.01.15 16:26

по картинкам можно получать посетителей. в стате встречаю 2-3 перехода именно с поиска по картинкам. если оптимизировать, толк будет.

Оставить комментарий

наверх